Thứ Năm, 27 tháng 4, 2023

Chính tả số

Hà Dương Tường

Theo các sử gia khoa học, con người biết đếm với tiếng nói của mình (một, hai, ba...) trước khi phát minh ra những ký hiệu dùng để ghi các con số và dùng chúng để tính toán. Những ký hiệu khác nhau, tuỳ theo dân tộc nay ta gọi là chữ số. Do trình độ văn minh, hai trong các hệ thống chữ số đó được biết nhiều nhất là các số La Mã (I, II, III, IV, V...) và Trung Hoa (一, 二, 三, 四, 五...), nhưng cả hai đều không thuận tiện đối với các số lớn và cho việc tính toán. Hiện tượng này được khắc phục khi người Ấn Độ khám phá ra "hệ đếm dùng vị trí" : chỉ với mười ký hiệu tượng trưng cho các con số từ không tới chín, người ta có thể viết ra mọi số nguyên. Những ký hiệu đó ngày nay được viết theo mẫu mã do người A-rập tạo ra và truyền sang châu Âu và lan ra khắp thế giới. Mười ký hiệu đó là:

0, 1, 2, 3, 4, 5, 6, 7, 8, 9

(không, một, hai, ba, bốn, năm, sáu, bảy, tám, chín)

Như đã nói, đó là những ký hiệu chỉ các số từ không tới chín. Cho các số lớn hơn, người ta chia ra từng gói : hàng chục, hàng trăm, hàng nghìn..., và viết các số theo cột từ trái sang : con số đầu tiên là số đơn vị, tiếp theo là số chục, tiếp nữa là số trăm.... Nếu con số nhỏ hơn hoặc bằng chín thì chỉ cần một ký hiệu, ví dụ 6 là sáu. Con số lớn hơn chín, nhưng nhỏ hơn một trăm sẽ được biểu diễn bằng hai ký hiệu. Ví dụ 87 là tám mươi bảy (tám lần mười cộng bảy), 80 là tám lần mười, không cộng thêm đơn vị nào. Như vậy "hai trăm lẻ chín" là một con số gồm hai trăm cộng với chín và không cộng thêm số chục nào, và được viết bằng 209.

Trên đây là những điều mà ngày nay người nào đã học qua tiểu học đều biết. Thế nhưng..., vậy mà không phải vậy ! Đọc sách báo Việt Nam hôm nay, người ta lại khám phá ra một hiện tượng mới lạ. Chẳng hạn như đoạn văn này, trích từ “Quy định tiêu chuẩn, thủ tục bổ nhiệm, miễn nhiệm chức danh giáo sư, phó giáo sư”, một văn bản chính thức :

"Có ít nhất 06 năm, trong đó phải có 03 năm cuối liên tục tham gia đào tạo, bồi dưỡng từ trình độ đại học trở lên tính đến ngày hết hạn nộp hồ sơ." (điều 6, khoản 2 về Tiêu chuẩn chức danh phó giáo sư).

Vậy là thế nào? Số sáu được biểu diễn bằng một ký hiệu kép "06", cũng như số ba bằng ký hiệu kép "03". Và muốn biểu diễn con số tám mươi bảy trên kia, chắc người ta phải viết 0807, hoặc hai trăm mười chín phải viết 020109?

Dĩ nhiên là không, và thực ra chỉ có một kết luận duy nhất được rút ra: cách viết "06" thay cho 6, "03" thay cho 3 trong đoạn văn trên là phi khoa học và không thể chấp nhận được. Cũng phải nói là cách viết này chỉ mới xuất hiện từ vài năm nay (chắc là từ buổi giao thời giữa hai cuộc cách mạng công nghiệp 03 và 04 ?!), và có vẻ như ngoài Việt Nam không có nước nào khác sử dụng. Người viết bài này thường xuyên đọc báo Pháp và thi thoảng báo tiếng Anh, chưa hề thấy có hiện tượng này. Báo tiếng Pháp khi phải nói tới một con số đơn vị (nhỏ hơn 10) thường viết nguyên chữ (sept, cinq... chứ không viết 7 hay 5, càng không có 07 và 05!). (*)

Nhưng tại sao thế, tại sao lại có lỗi kỳ quặc như vậy ?

Giả thuyết của người viết bài này là lỗi đó bắt nguồn từ một cách viết ngày tháng trong các văn bản chính thức. Để thuận tiện, nhất là từ khi có máy tính, người ta dành sẵn số ô chỉ ngày, tháng, năm cho người khai văn bản điền vào: hai ô cho ngày (vì chí là một con số từ một tới 31), hai ô cho tháng và bốn cho năm (còn dùng được lâu chán, cho tới hết năm 9999!) :

d

d

m

m

y

y

y

y

(tên ngày tháng viết tắt theo tiếng Anh, không phải vì "sính" mà vì dùng tiếng Việt hai chữ "ngày" và "năm" đều bắt đầu bằng "n").

Ngoài khuôn khổ các văn bản chính thống như nói trên, người ta quen dùng một dấu / để phân loại thời gian, và ta có: dd/mm/yyyy , chẳng hạn 12/03/2019. Từ đó nhiều người có thói quen viết các số đơn vị với số 0 đằng trước (để trám đầy các ô đã dành sẵn), một thói quen biến tiếng Việt thành thứ tiếng có lẽ duy nhất trên thế giới mà các số đơn vị được biểu hiện bằng hai ký tự, với ký tự 0 ở bên trái.

Giả thuyết trên đây đúng hay sai, chuyện chẳng quan trọng lắm, vấn đề là hãy trở lại cách viết đúng: chả có có số nào là "06" hay "03", mà chỉ có 6 hoặc 3. Còn cách viết 06 hay 03 chỉ chấp nhận được khi viết trong một khung định sẵn và cần trám cả hai ô, vì một lý do nào đó.

Nhưng giả thuyết trên lại dẫn tới một vấn đề khác: cách viết ngày tháng bằng những con số. Trước hết, hãy xét trường hợp chỉ có ngày và tháng được nêu ra, hiểu thế nào khi ta đọc một văn bản có ngày 3/8 (hay 03/08) ? Mồng ba tháng tám hay mồng tám tháng ba ? (tất nhiên, 19/3 thì khác, không thể hiểu là mồng ba tháng mười chín được !). Câu hỏi không đặt ra cho tới ít nhất là nửa đầu thế kỷ trước, khi cách viết của chúng ta chịu ảnh hưởng chính từ người Pháp, chỉ có một lời giải : ngày rồi mới đến tháng. Nhưng từ khi hàng trăm ngàn, hàng triệu người Việt sang Mỹ, làm quen với cuộc sống Mỹ... thì khác. Khi người Mỹ viết 3/8 thì đó là tháng 3 mồng tám ! Nói như thế cũng không hoàn toàn đúng, thật ra người Mỹ có truyền thống từ xưa là khi viết thư từ không lưu ý tới năm và luôn luôn viết tháng rồi mới đến ngày, nhưng là tháng viết bằng chữ chứ không phải số: march/8 thì không thể nhầm lẫn được với august/3. Thực ra, người Mỹ hay Âu thì các tháng của họ cũng có tên riêng chứ không phải là được gọi bằng thứ tự trong năm, và ngay bây giờ, tôi vẫn thường thấy họ viết nguyên tên tháng trên các thư từ, bài vở. Đây là bản chụp một phần của măng-xét báo New York Times hôm tôi viết bài này:


Còn đây là trên báo The Guardian (xin lưu ý, dù là ấn bản Mỹ, nhưng tờ báo xuất phát từ Anh vẫn giữ truyền thống ngày trước, tháng sau)


Cả hai đều ghi rõ tên tháng bằng tiếng Anh chứ không phải bằng số, khác biệt là tờ Guardian theo truyền thống Âu, ghi theo thứ tự ngày, tháng, năm, trong khi tờ NYT theo thứ tự tháng, ngày, năm. Vậy thì chẳng có hiểu nhầm gì xảy ra, và ai thích viết kiểu nào cứ viết (tôi sẽ trở lại chuyện này sau). Vấn đề là thói quen của người Việt, viết tên tháng bằng con số (cũng dễ hiểu, "tháng ba" thì đích thực là tháng thứ 3 chứ còn gì!). Và điều đó gây nhầm lẫn nếu không có một cách viết thống nhất. Nhầm lẫn ngày tháng của một sự kiện quan trọng có thể gây ra những hậu quả... nghiêm trọng! Phải chăng, ta cần có những quy định có tính pháp lý rõ ràng về chuyện viết ngày tháng này? Chọn kiểu Mỹ cũng được, kiểu Âu hay đúng hơn là kiểu "ngoài Mỹ" cũng được, nhưng phải thống nhất.

Tất nhiên, đó là nói nguyên tắc thôi, riêng đối với người viết bài này, "kiểu Âu" đã vào truyền thống của ta từ lâu, không có nghĩa là không thể thay đổi nhưng chưa thấy có lý gì đủ thuyết phục để thay đổi. Nhất là khi thứ tự ngày/tháng/năm hợp tự nhiên hơn là thứ tự tháng/ngày/năm.

Tới đây, lại một câu hỏi khác đặt ra, thế còn các thứ tự năm/tháng/ngày/ hay năm/ngày/tháng... ?

Câu trả lời lại đến từ nhu cầu của máy tính : Cái dấu phân cách / thật ra rất bất tiện, và thậm vô ích ! Một chuỗi 8 số, hai cho ngày, hai cho tháng và bốn cho năm, viết liền nhau là đủ để xác định một thời điểm một khi thứ tự đã được chọn: 08112018 cho mồng tám tháng 11 năm 2018 (hoặc tháng 8 ngày 11 năm 2018 nếu theo kiểu Mỹ). Vâng, nhưng... Có nhiều chương trình cần so sánh tự động hai chuỗi số như thế để biết cái nào là của một thời điểm đi trước, cái nào đi sau..., và lời giải là duy nhất : Chỉ khi ta chọn thứ tự năm/tháng/ngày, với 4 số đầu chỉ năm, hai số tiếp chỉ tháng và hai số cuối cùng chỉ ngày, ta mới có được một phép so sánh đơn giản : số lớn hơn chỉ một thời điểm đi sau thời điểm của số nhỏ hơn. Chẳng hạn 2018mmdd lớn hơn 2017m'm'd'd' với bất kỳ các trị số nào của m, d, m', d', do đó bất kỳ ngày nào trong năm 2018 là ở thì tương lai của bất cứ ngày nào trong năm 2017. Thế thôi. Các chọn lựa khác đều không bảo đảm thứ tự số/thời gian tương đương như vậy. Ví dụ kiểu Âu, ngày 3 tháng 9 năm 2018 đi sau bất kỳ ngày nào năm 2017, nhưng số 03092018 lại lớn hơn 02092017 và nhỏ hơn 04092017.

Và khi bạn muốn lưu một văn bản có thể được sửa đổi sau này, và dễ tìm ra trong chuỗi các tệp có trong máy tính cái nào được viết trước, cái nào được sửa đổi sau đó, thì cách đơn giản nhất là đặt tên cho nó với một chuỗi tám số chỉ ngày tháng như nói trên. Dĩ nhiên, nguyên tắc này cũng có thể áp dụng nếu bạn muốn một chuỗi số chỉ thời điểm kể cả giờ, phút, giây. Điều này cũng được thể hiện trong chuẩn quốc tế ISO 8601 về cách viết ngày tháng, bạn đọc có thể xem thêm thông tin về chuẩn này trên Wikipedia.

Như nói trên, tôi đã đặt bút viết bài này trong một ngày tháng 3 năm 2019, nhưng rồi bỏ ngang vì thấy cũng không còn hứng thú, mấy hôm nay đọc về chuyện chính tả của Tạ Quang Đông trên trang "giữ gìn sự trong sáng của tiếng Việt" của anh ấy, thấy câu chuyện có lẽ cũng không đến nỗi vô ích, bèn viết tiếp trình làng, gọi là "mua vui cũng được một vài trống canh" khi "tháng ăn chơi" chưa hết, có chi thất thố xin bà con miễn thứ cho.

9/2/2023

Hà Dương Tường

(*) Tái bút. 

Một người bạn của tác giả sau khi đọc bản thảo cho biết: Theo quy định của Liên Hiệp Quốc và Tổ chức Thương Mại Thế giới (WTO) - nơi chị là thông dịch viên cao cấp trước khi về hưu, thi tất cả các số nguyên từ "không" cho tới "mười một" phải được viết bằng chữ trong các văn bản chính thức, trừ một số trường hợp như số phần trăm, ngày tháng, giờ và các đơn vị đo lường. Như vậy, phải viết:

- Bảy nước, mười một thành viên, tám tuổi...

- 27 nước, 15 thành viên, 12 tuổi...

- 0%, 6%, 3kg, 17g...

Trường hợp đặc biệt, số không dù đứng trước một đơn vị đo lường, vẫn phải viết bằng chữ (tiếng Pháp : zéro tonne...).