Cơ bản về XML
Cũng tương tự HTML là ngôn ngữ đánh dấu văn bản, nhưng XML 1 ưu điểm nổi là các thẻ đều do người dùng tự định nghĩa, không giống như HTML là phải tuân thủ theo các thẻ được xây dựng sẵn.
Ví dụ về HTML và XML:
HTML
<!DOCTYPE html> <html> <head> <title>Tiêu đề </title> </head> <body> <p>Nội dung</p> </body> </html>
XML
<?xml version="1.0" encoding="utf-8" ?> <Authors> <Author id="01">Kevin La</Author> <Author id="268">Nguyen Nghia</Author> </Authors>
1 ví dụ XML có cấu trúc phúc tạp hơn:
<?xml version="1.0"?> <catalog> <book id="bk101"> <author>Gambardella, Matthew</author> <title>XML Developer's Guide</title> <genre>Computer</genre> <price>44.95</price> <publish_date>2000-10-01</publish_date> <description>An in-depth look at creating applications with XML.</description> </book> <book id="bk102"> <author>Ralls, Kim</author> <title>Midnight Rain</title> <genre>Fantasy</genre> <price>5.95</price> <publish_date>2000-12-16</publish_date> <description>A former architect battles corporate zombies, an evil sorceress, and her own childhood to become queen of the world.</description> </book> </catalog>
Lưu ý: Tài liệu XML bắt buộc phải có 1 thẻ root. Thẻ root này sẽ chứa tất cả các thẻ con nằm trong nó. Thẻ root ở hai ví dụ trên là <authors></authors>
và <catalog></catalog>
.
Để hiểu rõ hơn về tài liệu XML có thể tham khảo bài viết Cơ Bản Về XML.
Thư viện TinyXML
Giới thiệu
TinyXML là 1 thư viện mã nguồn mở C++, thao tác với tài liệu XML thông qua mô hình DOM (Document Object Model).
Có thể download thư viện tại đây.
Sơ đồ phân cấp lớp của thư viện này được mô tả như hình dưới đây:
Với thông tin về mỗi lớp như sau:
Tên Class | Thông tin về Class |
TiXmlAttribute | Đại diện cho thuộc tính, là 1 cặp name-value |
TiXmlBase | Là class cơ sở của tất cả mọi class trong TinyXML |
TiXmlComment | Đại diện cho comment trong tài liệu XML |
TiXmlDeclaration | Đại diện cho những khai báo ở đầu file trong tài liệu XML |
TiXmlDocument | Đại diện cho 1 tài liệu XML, chứa tất cả các thông tin về tài liệu này. |
TiXmlElement | Đại diện cho 1 node trong tài liệu XML |
TiXmlNode | Là class cơ sở trong mô hình DOM |
TiXmlText | Đại diện cho nội dung của 1 node trong tài liệu XML |
Thêm thư viện vào Project
Tạo 1 Empty Project Console C++ với tên Project là Demo_TinyXML
. Sau đó download thư viện và giải nén. Trong thư mục vừa mới giải nén chỉ quan tâm tới những file cần thiết là các file:
- tinyxmlerror.cpp
- tinyxmlparser.cpp
- tinystr.cpp
- tinystr.h
- tinyxml.cpp
- tinyxml.h
Copy những file này vào thư mục project.
Sau đó thêm những file vào project trên Visual Studio bằng cách chuột phải (right-click) vào project chọn Add > Existing Item... và chọn những file trên và nhấn Add để kết thúc. Và kết quả sẽ như sau:
Và thêm #include "tinyxml.h"
vào đầu những file muốn sử dụng thư viện này:
#include "tinyxml.h"
Thao tác với tài liệu XML
Trong bài viết này sẽ thao tác với tài liệu XML có nội dung như sau, việc thao tác với những tài liệu XML khác hoàn toàn tương tự.
<?xml version="1.0" encoding="utf-8" ?> <!--Demo read, write, edit XML document using TinyXML library--> <Authors> <Author id="01"> <Name>Kevin La</Name> <Age>27</Age> </Author> <Author id="268"> <Name>Nguyen Van Nghia</Name> <Age>20</Age> </Author> </Authors>
Read
Tạo 1 file có tên là Authors.xml
có nội dung như trên và copy file này vào thư mục project.
Các bước để đọc 1 tài liệu XML:
Bước 1: Load tài liệu lên bộ nhớ.
Bước 2: Lấy thông tin của node gốc (root element).
Bước 2: Lần lượt truy vấn qua các node con để lấy được thông tin cần thiết.
Đọc tài liệu Authors.xml
như sau:
Load tài liệu:
TiXmlDocument doc("Authors.xml"); if (!doc.LoadFile()) { printf("%s", doc.ErrorDesc()); return -1; }
Lấy thông tin node gốc
TiXmlElement* root = doc.RootElement();
Truy vấn qua từng node và xuất thông tin:
int id; //Tìm phần tử con đầu tiên của node roor TiXmlElement* child1 = root->FirstChildElement(); //Lấy ra id của Author child1->QueryIntAttribute("id", &id); //Truy vấn đến phần tử con đầu tiên của child1 TiXmlElement* name = child1->FirstChildElement(); //Truy vấn đến phần tử tiếp theo cùng cấp name TiXmlElement* age = name->NextSiblingElement(); //Xuất id cout << id << " "; //Xuất name cout << name->GetText() << " "; //Xuất age cout << age->GetText() << endl; //Truy xuất đến phần tử tiếp theo cùng cấp với child1 TiXmlElement* child2 = child1->NextSiblingElement(); //Lấy ra id của Author child2->QueryIntAttribute("id", &id); //Truy vấn đến phần tử con đầu tiên của child2 name = child2->FirstChildElement(); //Truy vấn đến phần tử tiếp theo cùng cấp name age = name->NextSiblingElement(); //Xuất thông tin của author cout << id << " "; cout << name->GetText() << " "; cout << age->GetText() << endl;
Kết quả:
Giả sử có rất nhiều author
, thì giải pháp tốt nhất là sẽ sử dụng vòng lặp để duyệt qua tất cả các node:
TiXmlElement* author = nullptr; int id; for (author = root->FirstChildElement(); author != NULL; author = author->NextSiblingElement()) { author->QueryIntAttribute("id", &id); TiXmlElement* name = author->FirstChildElement(); TiXmlElement* age = name->NextSiblingElement(); cout << id << " "; cout << name->GetText() << " "; cout << age->GetText() << endl; }
Có thể tìm hiểu rõ hơn về các phương thức FirstChild
, LastChild
, PreviousSibling
, NextSibling
, NextSiblingElement
để có thể truy vấn trong tài liệu XML 1 cách hiệu quả.
Write
Ở phần này sẽ tạo lại 1 tài liệu XML có nội dung như Authors.xml
nhưng lưu lại với tên là Author_Write.xml
.
Tài liệu XML là 1 mô hình phân cấp. Nghĩa là 1 1 node trong tài liệu XML đồng thời là cha của node này và là con của node kia. Ví dụ trong tài liệu Authors.xml
thì Authors là cha của các Author
, các Author
là anh chị em với nhau. Mỗi Author
đều có thuộc tính id
và có hai con là Name
và Age
. Cách tạo tài liệu XML cũng dựa trên điều này. Tạo ra các TiXmlElement
và dùng phương thức có prototype như sau để thể hiện mối quan hệ trên:
TiXmlNode* TiXmlNode::LinkEndChild (TiXmlNode * addThis)
Tạo 1 đối tượng TiXmlDocument
và thêm các node TiXmlDeclaration
, TiXmlComment
, đối tượng root TiXmlElement
vào tài liệu này:
//Tạo đối tượng quản lý tài liệu XML TiXmlDocument doc; //Tạo chỉ thị của tài liệu XML bao gồm version, endcoding sau đó thêm dec vào tài liệu TiXmlDeclaration *dec = new TiXmlDeclaration("1.0", "utf-8", ""); //Thêm dec vào tài liệu doc.LinkEndChild(dec); //Tạo comment và thêm comment vào tài liệu TiXmlComment *cmt = new TiXmlComment("Demo read, write, edit XML document using TinyXML library"); doc.LinkEndChild(cmt); //Tạo node root và thêm root vào tài liệu TiXmlElement* root = new TiXmlElement("Authors"); doc.LinkEndChild(root);
Tạo hai đối tượng Author
và thêm vào node root
//Tạo Author1 TiXmlElement* author1 = new TiXmlElement("Author"); //Set id cho author1 author1->SetAttribute("id", 1); //Thêm author1 vào root root->LinkEndChild(author1); //Tạo Author2 TiXmlElement* author2 = new TiXmlElement("Author"); //Set id cho author2 author2->SetAttribute("id", 268); //Thêm author2 vào root root->LinkEndChild(author2);
Với mỗi Author
ta sẽ tạo hai node là Name
, Age
và set nội dung cho chúng, sau đó add vào node Author
tương ứng.
Author1
//Tạo node Name TiXmlElement* author1_name = new TiXmlElement("Name"); author1->LinkEndChild(author1_name); TiXmlText* name_content_1 = new TiXmlText("Kevin La"); author1_name->LinkEndChild(name_content_1); //Tạo node Age TiXmlElement* author1_age = new TiXmlElement("Age"); author1->LinkEndChild(author1_age); TiXmlText* age_content_1 = new TiXmlText("27"); author1_age->LinkEndChild(age_content_1);
Author2
//Tạo node Name TiXmlElement* author2_name = new TiXmlElement("Name"); author2->LinkEndChild(author2_name); TiXmlText* name_content_2 = new TiXmlText("Nguyen Van Nghia"); author2_name->LinkEndChild(name_content_2); //Tạo node Age TiXmlElement* author2_age = new TiXmlElement("Age"); author2->LinkEndChild(author2_age); TiXmlText* age_content_2 = new TiXmlText("20"); author2_age->LinkEndChild(age_content_2);
Lưu tài liệu XML.
doc.SaveFile("Authors_Write.xml");
Dưới đây là toàn bộ souce code tại ra file Authors_Write.xml
//Tạo đối tượng quản lý tài liệu XML TiXmlDocument doc; //Tạo chỉ thị của tài liệu XML bao gồm version, endcoding sau đó thêm dec vào tài liệu TiXmlDeclaration *dec = new TiXmlDeclaration("1.0", "utf-8", ""); //Thêm dec vào tài liệu doc.LinkEndChild(dec); //Tạo comment và thêm comment vào tài liệu TiXmlComment *cmt = new TiXmlComment("Demo read, write, edit XML document using TinyXML library"); doc.LinkEndChild(cmt); //Tạo node root và thêm root vào tài liệu TiXmlElement* root = new TiXmlElement("Authors"); doc.LinkEndChild(root); //Tạo Author1 TiXmlElement* author1 = new TiXmlElement("Author"); //Set id cho author1 author1->SetAttribute("id", 1); //Thêm author1 vào root root->LinkEndChild(author1); //Tạo Author2 TiXmlElement* author2 = new TiXmlElement("Author"); //Set id cho author2 author2->SetAttribute("id", 268); //Thêm author2 vào root root->LinkEndChild(author2); //Tạo node Name TiXmlElement* author1_name = new TiXmlElement("Name"); author1->LinkEndChild(author1_name); TiXmlText* name_content_1 = new TiXmlText("Kevin La"); author1_name->LinkEndChild(name_content_1); //Tạo node Age TiXmlElement* author1_age = new TiXmlElement("Age"); author1->LinkEndChild(author1_age); TiXmlText* age_content_1 = new TiXmlText("27"); author1_age->LinkEndChild(age_content_1); //Tạo node Name TiXmlElement* author2_name = new TiXmlElement("Name"); author2->LinkEndChild(author2_name); TiXmlText* name_content_2 = new TiXmlText("Nguyen Van Nghia"); author2_name->LinkEndChild(name_content_2); //Tạo node Age TiXmlElement* author2_age = new TiXmlElement("Age"); author2->LinkEndChild(author2_age); TiXmlText* age_content_2 = new TiXmlText("20"); author2_age->LinkEndChild(age_content_2); doc.SaveFile("Authors_Write.xml");
Build và chạy chương trình, sau đó mở thư mục chứa project sẽ thấy file Authors_Write.xml
được tạo ra với nội dung giống như file Authors.xml
.