Chữ viết là một trong những phát minh vĩ đại của con người, không có bất cứ một lĩnh vực nào trong đời sống không sử dụng đến chữ viết.
Trong lập trình, chữ viết được sử dụng với 1 khái niệm được gọi là chuỗi.
Khái niệm về chuỗi
Với con người, ngôn ngữ, chữ viết là điều không thể thiếu trong cuộc sống thường nhật, nó giúp phân biệt và lưu trữ trí tuệ, kinh nghiệm, nhờ ngôn ngữ mà con người trao đổi thông tin dễ dàng hơn.
Ngôn ngữ được diễn đạt bằng nhiều hình thức, trong đó có chữ viết. Trong lập trình cũng vậy, luôn tồn tại nhu cầu sử dụng các dãy chữ có ý nghĩa, các dãy chữ đó được gọi là chuỗi.
Chuỗi được diễn tả bằng một dãy các ký tự đặt trong cặp ngoặc kép, ví dụ như:
"Hello World!"
"Stdio"
"Nguyen Minh Hieu"
- ...
Về bản chất lập trình, chuỗi được quy định là 1 mảng các ký tự liên tiếp nhau, kết thúc ở ký tự \0
.
Khai báo chuỗi
Có thể khai báo chuỗi bằng nhiều cách:
// Cách thông thường char str1[20] = "Stdio"; // Cách khai báo từng phần tử, ít được sử dụng char str2[20] = { 'S', 't', 'd', 'i', 'o', '\0' };
// Sử dụng thư viện std::string của C++ string str3 = "Stdio";
Đây là một khái niệm quan trọng và được sử dụng nhiều, C++ cung cấp 1 thư viện để xử lý chuỗi là std::string, nó giúp tiết kiệm thời gian với các tính năng hữu ích như nối chuỗi, tạo chuỗi nhanh chóng hay sao chép chuỗi, quản lý độ dài, ...
Với các loại chuỗi như tiếng Việt có dấu, cần 1 phương pháp lưu trữ khác như Unicode UTF-8 hoặc UTF-16.