Vì sao AI viết tiếng Việt nghe như văn dịch?

Phần lớn dữ liệu huấn luyện về tài chính là tiếng Anh, nên model có xu hướng 'dịch trong đầu' rồi viết ra: giữ nguyên cấu trúc câu tiếng Anh (em-dash appositive, chuỗi cụm danh từ), calque thuật ngữ ('trực tiếp' thay vì 'theo thời gian thực'), và collocation gượng ('thị trường có niềm tin tích cực mạnh'). Từng từ đều đúng nhưng cả câu không giống người Việt viết.

Chỉ cần viết rule vào system prompt là đủ chưa?

Chưa. Rule chung chung kiểu 'viết tự nhiên, đừng dịch sát' gần như không có tác dụng — model nào cũng tự tin là mình đang viết tự nhiên. Rule phải cụ thể đến mức trích được đoạn lỗi, gọi tên loại lỗi và đưa ví dụ trước/sau. Đó là lý do skill cần taxonomy lỗi và glossary riêng thay vì một câu nhắc.

Skill này có thay được biên tập viên người Việt không?

Không. Skill bắt tốt tầng lỗi lặp lại được — translationese, hype, sai register, calque thuật ngữ — giúp bản thảo sạch hơn trước khi đến tay người. Quyết định cuối về giọng thương hiệu, sắc thái và độ chính xác số liệu vẫn cần biên tập viên bản ngữ.

Xây dựng skill AI review văn phong tiếng Việt: 5 bài học thực tế

AI hiện nay viết tiếng Việt gần như không sai chính tả — nhưng đọc lên vẫn biết ngay "không phải người Việt viết". Vấn đề không nằm ở từng từ mà ở translationese: cấu trúc câu tiếng Anh, collocation gượng, và giọng quảng cáo dịch từ marketing tiếng Anh. Bài viết này chia sẻ cách chúng tôi xây skill /beaverx:wording-review-vn để review văn phong tiếng Việt cho nội dung fintech — những vấn đề gặp phải và các ý tưởng chính quyết định skill hoạt động được.

Một skill review văn phong = taxonomy lỗi + glossary + quy trình

Rule chỉ 'sống' khi cụ thể đến mức trích được đoạn lỗi và gọi tên loại lỗi

Nhóm lỗi trong taxonomy, xếp theo rủi ro

Điểm checklist chạy cho mọi đoạn text

Vấn đề: AI viết tiếng Việt sai ở tầng nào?

Khi review output tiếng Việt của model mạnh, lỗi chính tả và thiếu dấu gần như không còn. Lỗi thật nằm ở tầng style và độ tin cậy — những lỗi mà checker chính tả không bắt được:

Loại lỗi	AI hay viết	Người Việt sẽ viết
Calque thuật ngữ	"tất cả dữ liệu trực tiếp"	"theo thời gian thực"
Dịch sát cấu trúc	"mở khóa tiềm năng tài sản của bạn"	"hiểu rõ hơn cơ hội và rủi ro của tài sản"
Collocation gượng	"thị trường có niềm tin tích cực mạnh"	"tâm lý thị trường đang cải thiện"
Tone quảng cáo	"Cơ hội bùng nổ không thể bỏ lỡ"	"Diễn biến đáng chú ý cần theo dõi thêm"
Danh từ hóa	"thực hiện việc tối ưu hóa khả năng ra quyết định"	"giúp bạn ra quyết định rõ hơn"

Trong ngữ cảnh fintech, một số lỗi còn vượt khỏi phạm trù "văn phong": câu khẳng định quá chắc về đầu tư, số liệu không nguồn, hay thiếu lưu ý rủi ro có thể gây hiểu nhầm tài chính thật — nghiêm trọng hơn nhiều so với một câu hơi gượng.

Bài học 1: Phải xác định register trước khi review

Đây là phát hiện quan trọng nhất trong quá trình xây skill. Ban đầu chúng tôi viết một bộ rule chung — và skill liên tục "sửa sai": nó gạch những câu hero text hoàn toàn ổn, vì áp rule của văn phân tích lên văn copy.

Cùng một câu lỗi cho ra hai bản đúng khác nhau tùy register:

	Register phân tích / báo cáo	Register copy / hero
Bản viết đúng	"Phân tích cổ phiếu và xác định ngành nào đang chịu áp lực. Chỉ số rủi ro và tâm lý thị trường toàn cầu được cập nhật theo thời gian thực."	"Theo dõi cổ phiếu, áp lực theo ngành, rủi ro toàn cầu và tâm lý thị trường — trong một góc nhìn dữ liệu thời gian thực."
Em-dash appositive	Cấm — đọc như dịch sượng	Được phép — punchy là cố ý
Liệt kê cụm danh từ	Cấm — phải viết câu có mạch, có động từ	Được phép
Công thức "Không chỉ A — mà còn B"	Cấm — báo cáo sẽ nghe như landing page	Được phép

Vì vậy bước 1 của quy trình review là bắt buộc xác định register trước — kỹ thuật/phân tích hay copy/marketing — và nếu không rõ, skill phải hỏi lại người dùng thay vì đoán. Cái sai không phải là cấu trúc câu, mà là cấu trúc câu đặt sai chỗ.

Bài học 2: Taxonomy lỗi xếp theo rủi ro vận hành, không theo ngữ pháp

Cách phân loại lỗi quen thuộc — ngữ pháp, chính tả, từ vựng — không phù hợp với fintech. Một câu hơi gượng nhưng đúng nghĩa chỉ là lỗi trung bình; ngược lại, một câu mượt mà nhưng hứa lợi nhuận là lỗi nghiêm trọng nhất. Chúng tôi xếp lại taxonomy theo thiệt hại nếu lỗi lọt ra production:

Mức độ	Nhóm lỗi	Vì sao xếp mức này
Nghiêm trọng	Khẳng định quá mức, tuyệt đối hóa ("an toàn 100%"), số liệu thiếu nguồn	Phá niềm tin thương hiệu, có thể gây hiểu nhầm tài chính
Cao	Dịch sát tiếng Anh, collocation gượng, register lẫn lộn, bỏ caveat rủi ro	Làm text "kém Việt" và kém tin cậy
Trung bình	Cú pháp nặng, danh từ hóa, lặp ý, dấu câu chưa sạch	Sửa để gọn hơn, không gây hại trực tiếp

Lỗi nguy hiểm nhất thường là câu hay nhất

Câu "Chúng tôi mang đến sự minh bạch tuyệt đối cho nhà đầu tư" đọc rất mượt — không lỗi ngữ pháp, không dịch sượng. Nhưng "tuyệt đối" là khẳng định không kiểm chứng được, và trong fintech đó là lỗi phải sửa trước tiên. Nếu chỉ tối ưu cho "độ mượt", skill sẽ bỏ qua chính loại lỗi đắt giá nhất.

Bài học 3: Glossary chống calque — và bẫy một từ hai nghĩa

Thuật ngữ tài chính là nơi AI sai tinh vi nhất. Không phải sai kiểu "volatility → tính dễ bay hơi" (model mạnh ít khi mắc), mà là bẫy đồng âm: một từ tiếng Anh có hai nghĩa tiếng Việt hoàn toàn khác nhau tùy ngữ cảnh.

Từ EN	Nghĩa A	Nghĩa B
equity	cổ phiếu (lớp tài sản)	vốn chủ sở hữu (bảng cân đối)
margin	biên lợi nhuận (gross/net margin)	ký quỹ (margin call)
return / yield	lợi nhuận, tỷ suất sinh lời	lợi suất (cổ tức, trái phiếu)
sentiment / confidence	tâm lý thị trường	niềm tin (consumer confidence)

Skill vì vậy đi kèm một file glossary.md riêng: cột "VI chuẩn" là từ nên dùng, cột "bẫy" là calque cần tránh. Khi nghi một thuật ngữ bị dịch sai, skill đối chiếu glossary thay vì tin vào trực giác của model — vì trực giác của model chính là thứ tạo ra calque ngay từ đầu.

Bài học 4: Tách rule khỏi quy trình — cấu trúc progressive disclosure

Bản nháp đầu tiên nhồi toàn bộ rule vào một file SKILL.md dài. Kết quả: phần quy trình bị loãng giữa hàng chục bảng rule, model lúc nhớ lúc quên. Cấu trúc cuối cùng tách làm ba:

beaverx-wording-review-vn/
├── SKILL.md              # Quy trình 4 bước + checklist 5 điểm + output template
└── references/
    ├── style-rules.md    # Rule chi tiết theo register + taxonomy lỗi
    └── glossary.md       # Thuật ngữ EN → VI + bẫy calque

beaverx-wording-review-vn/
├── SKILL.md              # Quy trình 4 bước + checklist 5 điểm + output template
└── references/
    ├── style-rules.md    # Rule chi tiết theo register + taxonomy lỗi
    └── glossary.md       # Thuật ngữ EN → VI + bẫy calque

SKILL.md chỉ giữ những gì cần cho mọi lượt review: quy trình, mức độ lỗi, định dạng đầu ra. Rule chi tiết và glossary nằm ở references/ — skill chỉ mở khi cần đối chiếu. Cách này vừa giữ context gọn, vừa cho phép bổ sung calque mới vào glossary mà không đụng vào quy trình.

ℹ

Trigger description quan trọng không kém nội dung skill

Người dùng hiếm khi nói "hãy chạy skill review văn phong". Họ nói "đoạn này dịch sượng quá", "nghe như Tây viết", "làm tự nhiên hơn đi". Description của skill phải liệt kê đủ các cách nói tự nhiên này — bằng cả tiếng Việt — để skill được kích hoạt đúng lúc mà không cần gọi tên.

Bài học 5: Output template cố định và nguyên tắc "đừng bịa lỗi"

Hai vấn đề hành vi xuất hiện khi chạy thử. Thứ nhất, mỗi lượt review trả về một định dạng khác nhau — lúc bullet, lúc bảng, lúc viết lại luôn không giải thích. Thứ hai, nghiêm trọng hơn: khi đưa một đoạn text đã tốt, model vẫn cố tìm ra vài "lỗi" để có cái mà sửa.

Giải pháp cho cả hai đều là ràng buộc tường minh:

Template đầu ra cố định: register nhận diện → danh sách vấn đề (mỗi lỗi có trích đoạn gốc, loại lỗi, mức độ, đề xuất sửa, lý do 1 câu) → bản viết lại liền mạch → ghi chú. Mỗi lỗi phải trích đúng đoạn gốc — không được nói chung chung "câu này hơi gượng".
Nguyên tắc chống bịa lỗi, viết thẳng vào skill: "Nếu đoạn đã tốt, nói thẳng là tốt và chỉ nêu chỉnh nhỏ (nếu có) — đừng bịa lỗi để có cái mà sửa." Không có dòng này, skill sẽ luôn "tìm được" lỗi, và người dùng dần mất niềm tin vào những cảnh báo thật.

Checklist xây một skill review văn phong

Thu thập lỗi thật trước, viết rule sau

Gom các đoạn AI viết bị chê 'dịch sượng' thực tế, phân cụm thành nhóm lỗi. Rule rút từ lỗi thật cụ thể hơn nhiều so với rule nghĩ ra từ đầu.

Xếp taxonomy theo rủi ro vận hành

Lỗi nào gây thiệt hại nếu lọt ra production thì xếp mức cao — kể cả khi câu đọc mượt. Với fintech: khẳng định quá mức và số liệu thiếu nguồn đứng đầu.

Tách rule theo register

Xác định các bối cảnh viết khác nhau (phân tích vs copy) và làm rõ rule nào chỉ áp cho register nào. Bắt buộc skill xác định register trước khi quét lỗi.

Xây glossary với ví dụ trước/sau

Mỗi thuật ngữ cần cột 'từ chuẩn' và cột 'bẫy calque'. Đặc biệt chú ý các từ một EN hai VI như equity, margin, yield.

Khóa định dạng đầu ra

Template cố định: trích đoạn gốc, gọi tên lỗi, mức độ, đề xuất, lý do. Thêm nguyên tắc 'text tốt thì nói là tốt' để chống bịa lỗi.

Chạy thử trên text đã tốt

Test quan trọng nhất không phải text nhiều lỗi mà là text sạch — skill có bịa lỗi không, và hero copy có bị áp nhầm rule phân tích không.

✦

Nguyên tắc cốt lõi khi dạy AI viết tiếng Việt

Rule chung chung kiểu "viết tự nhiên" gần như vô dụng — model nào cũng tin là mình đang viết tự nhiên. Rule chỉ hoạt động khi cụ thể đến mức kiểm tra được: trích được đoạn lỗi, gọi tên loại lỗi, có ví dụ trước/sau, và biết rule đó áp cho register nào. Tự nhiên hơn văn vẻ, đúng tiếng Việt hơn dịch literal, tin cậy hơn hype.

Không có bộ rule nào biến AI thành biên tập viên bản ngữ — nhưng một skill review với taxonomy lỗi rõ ràng, glossary chống calque và quy trình theo register sẽ chặn được phần lớn những câu "nghe như Tây viết" trước khi chúng đến tay người đọc.