A.I. và tiểu thuyết gia – Bạn hay thù? Phần 2: AI thực sự làm gì

Hãy thử tìm một cuốn tiểu thuyết bạn chưa từng nghe tên trên Project Gutenberg – kho lưu trữ này có hơn 70.000 đầu sách thuộc phạm vi công cộng, nhiều cuốn trong số đó thực sự đã bị lãng quên. Thử The Morgesons của Elizabeth Stoddard, xuất bản năm 1862, hay The Story of a New Zealand River của Jane Mander, 1920. Đưa vào NotebookLM. Hỏi về cấu trúc cốt truyện, mâu thuẫn nội tâm của nhân vật chính, những điểm ngoặt của câu chuyện. Mất khoảng mười phút. Sau đó tập hợp những gì NotebookLM trích xuất được và chuyển cho một mô hình ngôn ngữ hiện tại – Claude Sonnet 4.6, GPT- 5.4 (model phổ biến nhất trong thời điểm viết bài), tùy bạn chọn. Yêu cầu nó hiện đại hóa tiền đề: đặt câu chuyện ở Hà Nội năm 2025, gắn với những con phố có thật, lấy cảm hứng từ những sự kiện thành phố vừa trải qua. Đọc kết quả trả về.

Với hầu hết người thử thí nghiệm này, văn bản thu được vừa tốt hơn dự đoán, vừa tệ hơn dự đoán – theo những cách không triệt tiêu nhau. Văn phong đúng ngữ pháp, thường trơn tru. Khu Hoàn Kiếm hiện lên có hơi thở riêng, theo kiểu một người viết du lịch lành nghề vẽ ra. Nhân vật bước qua Phố Cổ lúc sáng sớm và cảnh đó trông rõ ràng là Hà Nội. Nhưng có gì đó vắng mặt – thứ khó đặt tên hơn là “sự sáng tạo” – cảm giác rằng mỗi câu văn được chọn bởi một người có thể viết khác đi nhưng chủ động không làm vậy, người có lý do để chọn từ này thay vì từ kia, người có điều gì đó đang bị đặt cược trong cách kể chuyện. Hiểu được sự vắng mặt đó theo nghĩa kỹ thuật, không phải theo nghĩa thi ca, là điều bài viết này muốn làm.

2.1 Bên trong cỗ máy: điều gì xảy ra khi bạn yêu cầu một LLM viết một chương

Mô hình ngôn ngữ lớn (LLM – Large Language Model) không phải là cơ sở dữ liệu, không phải công cụ tìm kiếm, và cũng không phải trí tuệ. Đó là một hệ thống thống kê được huấn luyện trên một lượng văn bản khổng lồ để dự đoán token tiếp theo có xác suất cao nhất – token ở đây là một mảnh từ, dấu câu, hay khoảng trắng – dựa trên tất cả những gì đã xuất hiện trước đó. “Được huấn luyện trên văn bản” có nghĩa là mô hình đã xử lý hàng tỷ câu văn đã được xuất bản: tiểu thuyết, fan fiction, diễn đàn viết lách, bình luận biên tập, các cuộc thảo luận trực tuyến về nghề viết. Từ đó nó rút ra các mẫu – không phải các quy tắc được lập trình rõ ràng, mà là những xu hướng được mã hóa trong các trọng số của mô hình: các chương truyện trinh thám thường mở đầu như thế nào, những cụm từ nào thường xuất hiện xung quanh cảnh đau buồn, những nhịp cấu trúc nào xuất hiện trong mọi cuốn tiểu thuyết lãng mạn trước điểm khủng hoảng giữa câu chuyện.

Hệ quả đối với văn xuôi hư cấu rất cụ thể. Khi bạn yêu cầu một mô hình viết chương tiếp theo của một tiểu thuyết ly kỳ, bạn không yêu cầu nó tưởng tượng điều gì nên xảy ra. Bạn đang yêu cầu nó tạo ra phần tiếp nối có xác suất thống kê cao nhất dựa trên những gì đã có – tức là phần tiếp nối giống nhất với các tiểu thuyết ly kỳ trong dữ liệu huấn luyện của nó. Điều này tạo ra văn xuôi cảm thấy có năng lực theo kiểu chung chung. Nó cũng tạo ra một lực kéo hấp dẫn về phía những gì đã được viết: cú twist được mong đợi, nhịp nhân vật quen thuộc, cấu trúc cảnh lặp lại trong hàng ngàn tiểu thuyết ly kỳ đã xuất bản vì nó từng hiệu quả. Sự độc đáo – theo nghĩa là thứ sẽ không xuất hiện nếu thiếu một nhà văn cụ thể này – chính xác là điều mà xác suất thống kê không ủng hộ.

Vấn đề về cửa sổ ngữ cảnh (context window) làm trầm trọng thêm điều này trong các tác phẩm dài. Mô hình chỉ có thể chú ý đến những gì nằm trong bộ nhớ hoạt động của nó tại thời điểm tạo văn bản. GPT- 4 Turbo, phát hành bởi OpenAI vào tháng 11 năm 2023, mở rộng cửa sổ ngữ cảnh lên 128.000 token – tương đương khoảng 240 trang văn xuôi. Claude Sonnet 4 hoạt động ở mức 200.000 token. Đây là những con số lớn. Nhưng chúng không đủ lớn. Karpinska và các cộng sự, khi kiểm tra bảy mô hình ngôn ngữ tiên tiến vào năm 2025 trên các nhiệm vụ đòi hỏi khả năng hiểu thực sự các văn bản dài bằng cuốn sách, phát hiện rằng không mô hình nào trong số bảy mô hình duy trì được sự hiểu biết tường thuật ổn định vượt quá khoảng 64.000 token – chưa bằng một nửa cửa sổ được quảng cáo của GPT- 4 Turbo. Liu và các cộng sự tại Stanford và UC Berkeley, công bố trên Transactions of the ACL năm 2024, đã ghi lại cơ chế nằm bên dưới: một đường cong độ chính xác hình chữ U, trong đó các mô hình nhớ tốt nhất tài liệu ở phần đầu và cuối ngữ cảnh, với độ chính xác giảm hơn 30 điểm phần trăm khi nội dung liên quan nằm ở giữa. Một chi tiết nhân vật được thiết lập ở chương ba, được truy xuất khi tạo chương mười lăm, rơi chính xác vào vùng bị ảnh hưởng bởi hiệu ứng này.

Còn một tham số kỹ thuật ít được thảo luận hơn nhưng có hệ quả trực tiếp đối với sự nhất quán tường thuật: temperature (nhiệt độ). Đây là thông số điều chỉnh mức độ ngẫu nhiên khi mô hình lấy mẫu từ phân phối xác suất của nó. Nhiệt độ thấp tập trung khối lượng xác suất vào token có khả năng nhất – đầu ra trở nên xác định và lặp lại. Nhiệt độ cao làm phẳng phân phối, khiến các token ít có khả năng hơn trở nên xác suất cao hơn – đầu ra trở nên đa dạng hơn nhưng cũng có nhiều khả năng mâu thuẫn với chính nó qua các trang. Peeperkorn và các cộng sự đã kiểm tra thực nghiệm mối quan hệ này vào năm 2024 và phát hiện rằng nhiệt độ cho thấy tương quan dương yếu với sự độc đáo và tương quan âm vừa phải với tính mạch lạc. Mức sáng tạo và mức mạch lạc dịch chuyển theo hướng ngược nhau. Không có cài đặt nhiệt độ nào cho bạn cả hai.

2.2 Những bước viết nào AI làm tốt, làm được, và làm kém?

Phần 1 của series này đã xác định bảy giai đoạn một cuốn tiểu thuyết trải qua từ cảm nhận đầu tiên đến bản thảo hoàn chỉnh: ủ ý, xác lập tiền đề, xây dựng thế giới, kiến trúc nhân vật, thiết kế cấu trúc, triển khai từng cảnh, và biên tập lại. Phần 1 cũng phân biệt giữa các bước cơ học – gần hơn với việc áp dụng mẫu – và các bước nhận thức đòi hỏi phán đoán trong điều kiện bất định thực sự.

Ranh giới cơ học/nhận thức đó cũng vận hành ở cấp độ từng giai đoạn, và ranh giới không cố định: cùng một giai đoạn trông khác nhau tùy thuộc vào loại tiểu thuyết. Cấu trúc trong tiểu thuyết trinh thám mang tính kiến trúc và tuân theo quy tắc; cấu trúc trong tiểu thuyết văn học lấy nhân vật làm trung tâm gắn liền với chính văn xuôi. Điều này có nghĩa là câu hỏi “AI có thể giúp xây dựng cấu trúc không?” có nhiều câu trả lời khác nhau tùy theo loại tiểu thuyết, và một phán quyết duy nhất cho từng giai đoạn sẽ gây hiểu lầm. Câu hỏi chính xác hơn cho mỗi giai đoạn là liệu nhiệm vụ đó có đòi hỏi tái tạo mẫu hay phán đoán trong điều kiện bất định thực sự.

Câu hỏi này chính xác kể cả khi chúng ta sử dụng các kỹ thuật mới với AI – bao gồm các pipeline nghiên cứu chuyên sâu (deep research pipeline), quy trình đa tác nhân (multi- stage agentic workflows), và RAG (Retrieval- Augmented Generation – tăng cường bằng truy xuất, một phương pháp truy vấn cơ sở dữ liệu đã được kiểm chứng thay vì chỉ dựa vào dữ liệu huấn luyện). Mặc dù những kỹ thuật này nâng cao hiệu quả của AI, nhưng chúng không thay đổi trần của lớp nhận thức.

Đầu tiên, giai đoạn Ủ ý – tích tụ chất liệu văn học mà chưa đi đến cấu trúc tiểu thuyết – vận hành trên hai tầng cần được tách biệt, vì các công cụ AI đã thực sự biến đổi một tầng và không thể chạm đến tầng kia.

Tầng đầu tiên là chuẩn bị có chủ đích: nghiên cứu định hướng sau khi nhà văn đã xác định được địa hạt của mình. “Tôi biết mình đang viết về cải cách ruộng đất ở đồng bằng sông Hồng những năm 1950 – tôi cần hiểu các chiến dịch đó, những làng xã kháng cự, chuyện gì đã xảy ra với những gia đình bị quy là địa chủ.” Điều này từng đòi hỏi nhiều tháng làm việc trong thư viện. Các pipeline nghiên cứu chuyên sâu – các tác nhân đa giai đoạn thu thập tài liệu lịch sử, xác định mâu thuẫn và lỗ hổng, đưa ra phản luận, và đánh dấu những đối chiếu bất ngờ – đã rút ngắn điều này đáng kể. Với một nhà văn lịch sử biết mình đang nghiên cứu gì, đây là một bộ tăng tốc thực sự.

Tầng thứ hai là tích lũy không có chủ đích: tài liệu đến mà không có gợi nhắc, không có định hướng, không có nhà văn biết mình đang thu thập nó để làm gì. Ví dụ như cách Toni Morrison giữ một tờ báo cắt về Margaret Garner nhiều năm trời trước khi tìm được hình thức mà Beloved đòi hỏi. Bà không nghiên cứu về chế độ nô lệ. Bà đang cảm nhận một điều gì đó về một mảnh báo cụ thể mà bà chưa thể đặt tên, và bà chờ đợi cho đến khi hiểu được hình thức mà cảm xúc đó đòi hỏi. Mọi giai đoạn của một pipeline nghiên cứu đa bước, và mọi lần truy xuất RAG, đều được kích hoạt bởi một gợi nhắc hoặc một đầu ra trước đó. Không có giai đoạn pipeline nào chạy mà không có định hướng. Sự tích lũy xảy ra trong những kẽ hở của sự chú ý có ý thức của nhà văn – nghe lỏm một cuộc trò chuyện, đọc nhầm một từ, cảm nhận một cảm xúc bất ngờ tại một khoảnh khắc bình thường – không có truy vấn tìm kiếm nào đi kèm. Bạn không thể yêu cầu AI thu thập “những thứ sẽ bất ngờ quan trọng với một cuốn tiểu thuyết tôi chưa biết là mình đang viết.” Đây là lý do tại sao những ý tưởng cho cuốn tiểu thuyết thực sự kỳ lạ – The Tin Drum, House of Leaves, Remainder – khó có thể xuất hiện trước tiên từ một pipeline nghiên cứu có sự hỗ trợ của AI. Các ý tưởng độc đáo lại đến từ những tài liệu mà nhà văn không thể nào prompt để lấy ra.

Giai đoạn hai, Xác lập tiền đề, là nơi nhà văn có thể phát biểu cuốn sách nói về điều gì và, quan trọng hơn, tại sao nó cần tồn tại. Phần hai của câu hỏi đó mang phần lớn trọng lượng nhận thức. Một tiền đề có thể hợp lý về mặt logic mà không cần thiết về mặt cảm xúc. Khi bạn yêu cầu một mô hình hiện tại tạo ra các tiền đề, nó tạo ra các sự kết hợp lại nhanh chóng và với số lượng lớn – năm mươi tiền đề trong vài giây, phần lớn trong số đó giống với các tiền đề đã tồn tại. Các pipeline đa giai đoạn làm tốt hơn đáng kể: một pipeline trước tiên lập bản đồ địa hạt văn học hiện có, xác định vùng cảm xúc chưa được khai thác, tạo ra các tiền đề nhắm vào những khoảng trống đó, và kiểm tra thử từng tiền đề trước những phản đối có thể có của độc giả – đang làm điều gì đó gần với những gì một biên tập viên sâu sắc làm khi đánh giá các đề xuất bản thảo. Nó thực sự có năng lực hơn một lần tạo ra đơn lẻ. Nhưng nó vẫn không thể đưa ra phán đoán tách biệt một tiền đề chỉ hợp lý về logic với một tiền đề cảm thấy cần thiết về mặt cảm xúc – cảm giác rằng có điều gì đó chưa được nói và đang đòi phải được nói, thứ thúc đẩy một nhà văn dành năm năm cho một dự án cụ thể.

Giai đoạn ba, Xây dựng thế giới và nghiên cứu là nơi năng lực thực sự của AI mạnh nhất, và là nơi các công nghệ của hai năm qua tạo ra sự khác biệt thực tiễn lớn nhất. Đây là giai đoạn cơ học nhất ở tầng thông tin: sự kiện về một thời kỳ lịch sử, quy tắc của một hệ thống ma thuật, địa lý của một thành phố. Tuy nhiên có sự khác biệt lớn giữa truy vấn LLM thông thường và truy vấn dựa trên tư liệu đã được tổng hợp trước. Một truy vấn LLM thông thường về thương mại thuộc địa Hà Lan ở Hội An thế kỷ mười bảy tạo ra một tổng hợp nghe có vẻ hợp lý – một số chính xác, một số sai một cách tự tin (và không hề để ý đến các nguồn thông tin không có trên internet). Một hệ thống RAG trong đó nhà văn đã tải các nguồn sơ cấp đã được kiểm chứng sẽ thay đổi cách phản hồi: mô hình sẽ truy xuất từ tài liệu đã biết, đã được tuyển chọn thay vì tạo ra từ phân phối xác suất trên toàn bộ dữ liệu huấn luyện. Với một nhà văn lịch sử đang xây dựng một thế giới phức tạp, một cơ sở tri thức được duy trì và truy vấn tại mỗi cảnh là một công cụ nhất quán thực sự.

Cảnh báo là việc xây dựng và duy trì cơ sở tri thức đó là công việc đòi hỏi kỹ năng và tốn nhiều thời gian – thứ không bao giờ xuất hiện trong các so sánh chi phí theo từng từ. Và những gì vẫn mang tính nhận thức xuyên suốt là quyết định lọc: Ví dụ như độ chính xác hàng hải của O’Brian trong các tiểu thuyết Aubrey- Maturin không phải là sản phẩm của việc biết nhiều sự kiện nhất. Đó là sản phẩm của việc biết chi tiết nào quan trọng với nhân vật này trong cảnh này. Một hệ thống RAG có thể cho bạn biết tiếng còi của boatswain nghe như thế nào năm 1805. Nó không thể cho bạn biết đây có phải là khoảnh khắc chi tiết đó sẽ khiến độc giả cảm thấy hiện diện thay vì chỉ được cung cấp thông tin hay không.

Kiến trúc nhân vật là nơi khoảng cách giữa cơ học và nhận thức rõ ràng nhất. Tầng cơ học – theo dõi rằng một nhân vật có mắt xanh, sinh ở Hà Nội năm 1978, thích nói bằng câu ngắn – là điều một character bible (sổ tay nhân vật) được duy trì bởi RAG xử lý ổn. Tầng nhận thức là logic nội tại: cấu hình cụ thể của các giá trị, nỗi sợ, thói quen và sự tự lừa dối khiến hành vi của một nhân vật cảm thấy như một người thay vì một danh sách các đặc điểm. Chakrabarty và các cộng sự tại Columbia và Salesforce AI Research đã đánh giá các truyện ngắn do AI tạo ra so với tác phẩm của các nhà văn chuyên nghiệp bằng cách sử dụng Torrance Tests of Creative Writing vào năm 2024, chấm điểm 48 truyện trên 14 thước đo nhị phân về tính độc đáo. Các nhà văn chuyên nghiệp vượt qua hơn 80% các bài kiểm tra đó; ChatGPT vượt qua khoảng 9% và Claude 1.3 khoảng 30%. Các lỗi cụ thể được nêu trong bài báo rất đáng chú ý: cụm từ sáo rỗng, lối kể lể phô bày thay vì cho thấy, nhân vật phát triển chưa đủ chiều sâu, và sức hút về phía các khuôn mẫu.

Sự nhàm chán của nhân vật AI không phải là lỗi bề mặt. Đó là điều xảy ra khi nhân vật được lắp ráp từ các mẫu về cách các nhân vật hư cấu thường hành xử thay vì từ một logic nội tại nhất quán của một người cụ thể. Chakrabarty, phát biểu với MIT Technology Review vào tháng 7 năm 2024, mô tả các truyện do AI tạo ra có “những dấu hiệu nhận biết rõ ràng, chẳng hạn như các câu rất dài, nặng về trình bày thông tin và chứa nhiều khuôn mẫu.” Một character bible RAG có thể đánh dấu khi một nhân vật hành xử không nhất quán với mẫu đã thiết lập. Nó không thể đánh dấu khi một nhân vật hành xử quá nhất quán – khi văn xuôi đã trở thành một sự thực thi trung thành của cơ sở dữ liệu thay vì một tâm lý sống. Độc giả người cảm nhận điều này như sự phẳng lặng. Không có kiểm tra tính nhất quán nào bắt được điều đó.

Thiết kế cấu trúc cho thấy ma trận loại tiểu thuyết rõ ràng nhất. Trong văn xuôi mạng và serial, cấu trúc phản hồi theo độc giả và tuân theo quy ước thể loại – đây chính xác là địa hạt AI hoạt động tốt nhất, có thể tạo ra các lựa chọn cấu trúc cho hồi tiếp theo dựa trên phản hồi và các mẫu thể loại. Trong tiểu thuyết trinh thám, cấu trúc mang tính kiến trúc và tuân theo quy tắc; AI có thể tái tạo các mẫu cấu trúc đã có (phòng bí ẩn, thủ tục điều tra, người kể chuyện không đáng tin) ổn, dù gặp khó khăn khi thiết kế các cấu trúc xuất phát từ một loại bí ẩn thực sự mới lạ. Trong tiểu thuyết văn học lấy nhân vật làm trung tâm, cấu trúc và văn xuôi là một – các quyết định cấu trúc được đưa ra ở cấp độ câu văn và không thể tách khỏi giọng văn. Ví dụ, cách sắp xếp thời gian trong Mrs Dalloway của Woolf, nơi hiện tại và quá khứ chạy song song, không được chọn từ một menu. Nó được khám phá trong quá trình hiểu cuốn tiểu thuyết thực sự nói về điều gì. Sự khám phá kiểu này đòi hỏi phải giữ một vấn đề trong sự bất định thực sự cho đến khi hình thức đúng đắn xuất hiện. Một hệ thống được thiết kế để tạo ra đầu ra có xác suất cao nhất tiếp theo không thể duy trì sự bất định đó.

Giai đoạn Triển khai từng cảnh hiện là lĩnh vực mà AI có năng lực rõ ràng nhất, và RAG đã cải thiện thêm. Trong một cửa sổ (context window) ngắn, các LLM tạo ra văn xuôi sạch về ngữ pháp, nhất quán về giọng điệu. Một hệ thống RAG mang theo một hướng dẫn phong cách được tuyển chọn – các ví dụ cụ thể về giọng văn mục tiêu, các quy tắc về nhịp câu, các mẫu có chú thích về các quyết định đặc trưng của tác giả – phần nào giải quyết sự trôi dạt về phía mức trung bình thống kê tích lũy theo độ dài. Nhưng giọng văn, như được định nghĩa trong Phần 1, bao gồm quyết định phá khỏi khuôn mẫu lựa chọn hợp lý. Một hướng dẫn phong cách có thể chỉ định giọng văn làm gì. Nó không thể chỉ định khi nào thì cần phá khỏi khuôn mẫu – bởi vì khuôn mẫu chính là cái mặc định, cái được mong đợi, cái có xác suất thống kê cao. Văn xuôi tuân theo khuôn mẫu một cách cơ học tạo ra những câu đúng về mặt kỹ thuật nhưng đọc như vô hồn. Đối thoại là điểm yếu cụ thể rõ rệt nhất: đối thoại AI có xu hướng khiến các nhân vật tự giải thích bản thân quá trực tiếp, nói ra những gì họ cảm thấy và muốn theo cách sẽ bất thường trong lời nói tự nhiên. Ngầm ý (subtext) – nhân vật muốn nói điều gì đó khác với những gì họ nói – không phải là mẫu xuất hiện đáng tin cậy trong dữ liệu huấn luyện, bởi vì điểm mấu chốt của ngầm ý chính là nó không được nói ra.

Biên tập lại là giai đoạn phân biệt rõ nhất cách các nhà văn có kinh nghiệm hiểu nghề từ cách nó hiện ra từ bên ngoài. Tầng biên tập cơ học được nâng cấp đáng kể bởi các pipeline đa giai đoạn: các lượt tuần tự bao gồm tính nhất quán về sự kiện, nhất quán nhân vật, lỗi liên tục và cơ học văn xuôi đáng tin cậy hơn nhiều so với yêu cầu một mô hình đơn lẻ “sửa lại cuốn tiểu thuyết này.” Với một tác giả tiểu thuyết mạng đang sản xuất nhanh với hai mươi nhân vật có tên xuyên suốt hàng trăm chương, việc biên tập tự động lượt đầu là một sàn chất lượng thực sự. Những gì không pipeline nào có thể làm là khởi xướng câu hỏi nhận thức lại: cuốn tiểu thuyết này có khiến trái tim rung động không? Một lượt rà soát cấu trúc có thể đánh dấu chi tiết đi lệch khỏi cốt truyện thực tế. Nó không thể nhận ra rằng hai chương đầu đang thực hiện một tông điệu chủ đề khác với phần còn lại, và rằng một trong số chúng phải bị từ bỏ. Và một biên tập viên ủy thác việc biên tập lại cấu trúc cho các AI pipeline dần mất đi năng lực đã được rèn luyện để nhận thức các vấn đề cấu trúc một cách độc lập – điều quan trọng khi AI bỏ sót điều gì đó. Người biên tập viên dần dần sẽ bỏ sót các vấn đề liên quan đến nhận thức. Đó chính xác là những vấn đề quyết định nhiều nhất liệu một cuốn tiểu thuyết hay hay dở.

2.3 AI hiện đang vượt trội hơn con người ở đâu – và trong điều kiện nào

Trực giác thông thường là văn xuôi công thức sẽ dễ tự động hóa hơn văn xuôi văn học. Điều này đúng một phần nhưng hiểu nhầm những gì văn xuôi công thức thực sự đòi hỏi. Như Phần 1 đã lưu ý, một tiểu thuyết lãng mạn hoạt động theo một hợp đồng với độc giả: nó phải kết thúc có hậu (HEA – Happily Ever After), và kỹ thuật nhà văn ở chỗ tìm ra một con đường mới đến đích đã được mong đợi. Tiền đề bị ràng buộc; cấu trúc bị ràng buộc; các nhịp cảm xúc bị ràng buộc. Những ràng buộc này chính xác là địa hạt AI hoạt động tốt nhất. Với một tiền đề lãng mạn và các quy ước thể loại rõ ràng, một mô hình tạo ra đầu ra đủ dùng với tốc độ không người viết nào có thể sánh – 10.000 từ trong vài giây, so với 2.000 đến 3.000 từ mà một nhà văn nhanh tạo ra trong một ngày làm việc.

Văn xuôi văn học là thứ có khả năng kháng cự AI hơn. Nền kinh tế uy tín của văn xuôi văn học có nghĩa là tầm nhìn cá nhân của nhà văn chính là sản phẩm được bán – không phải việc thực thi một hợp đồng thể loại. Độc giả văn xuôi văn học, theo định nghĩa, đang đọc để tìm thứ gì đó không thể đến từ nơi nào khác. Giọng văn đến từ sức mạnh thống kê của AI có thể bị độc giả nhận ra và tẩy chay. Tian và các cộng sự, kiểm tra các bản AI bắt chước 50 tác giả được khen ngợi quốc tế so với tác phẩm của sinh viên được đào tạo MFA năm 2025, phát hiện rằng các độc giả chuyên gia dễ dàng nhận ra AI viết và rất không ưa văn bản AI, với lý do nó quá hoàn hảo về phong cách.

Văn xuôi mạng và serial nằm ở đầu đối diện. Khối lượng sản xuất trong loại hình này cực kỳ lớn – các tác giả hàng đầu trên Qidian đăng 6.000 đến 10.000 chữ Hán mỗi ngày cho các độc giả đang bình luận theo thời gian thực – và hình thức này có tính chất tạo sinh và phản hồi theo thiết kế. Việc biên tập lại cấu trúc xuyên suốt toàn bộ hồi là không thể với định dạng serial. Các đòi hỏi nhận thức thực sự gần hơn với những gì AI hiện tại làm tốt: tạo sinh khối lượng lớn trong các quy ước thể loại, có thể điều chỉnh theo phản hồi của độc giả, nơi sự tham gia ở cấp độ chương quan trọng hơn tính mạch lạc ở cấp độ tổng quát.

Đối với dịch thuật và bản địa hóa, năng lực của AI đã vượt trội so với người dịch. Một cuộc khảo sát của Society of Authors năm 2024 phát hiện rằng 36% dịch giả đã mất việc do AI tạo sinh – không phải vì AI dịch sánh ngang với bản dịch con người tốt nhất, mà vì AI có khả năng tạo ra lượng bản dịch ở mức “đủ tốt” rất nhanh và rẻ so với con người. AI đã nâng cao đáng kể chất lượng đầu ra của các nhà văn ít kinh nghiệm trong khi không tạo ra lợi ích rõ rệt nào cho các nhà văn có kỹ năng tốt – và nó khiến chất lượng đầu ra bị cào bằng hơn.

2.4 Sử dụng AI có phải lúc nào cũng rẻ hơn thuê nhà văn người?

Tính đơn giản: một cuốn tiểu thuyết 90.000 từ được tạo ra qua API ở mức giá GPT- 5.4 hoặc Claude Sonnet 4.6 hiện tại – khoảng 15 USD cho mỗi triệu token đầu ra – có chi phí API thô khoảng 1,80 USD. Ngay cả với nhiều lần viết lại, sử dụng RAG lớn và rất nhiều quy tắc đầu vào, tổng chi phí API cho một cuốn tiểu thuyết hiếm khi vượt quá 20 đến 50 USD. Dữ liệu tổng hợp thị trường của Reedsy đặt phí thuê ghostwriter trung bình khoảng 20.000 USD, với các ghostwriter tiểu thuyết chuyên nghiệp tính phí 3.500 đến 16.000 USD ở mức thấp hơn và 30.000 đến 60.000 USD trở lên cho các nhà thực hành đã thành danh. Phép toán theo từng từ nghiêng về AI với hệ số khoảng 1.000 đến 10.000.

Phép toán bỏ sót ba loại chi phí ẩn.

Thứ nhất là chi phí xây dựng và duy trì cơ sở hạ tầng làm cho đầu ra AI có thể sử dụng được. Để AI soạn văn mạch lạc, nó đòi hỏi thiết kế theo dõi tiến độ truyện hiện tại, tóm tắt phần trước một cách có cấu trúc, và truy vấn kho kiến thức. Phép tính theo từng từ khiến AI trông rẻ thường chỉ đếm token API, bỏ qua lao động kỹ thuật và biên tập tạo ra nền tảng để làm cho những token đó tạo ra đầu ra nhất quán thay vì trôi dạt.

Thứ hai là chi phí kiểm soát chất lượng. Ví dụ như Death of an Author – một truyện vừa được nhà báo Stephen Marche tạo ra bằng ChatGPT, Cohere và Sudowrite, xuất bản bởi Pushkin Industries năm 2023 – được The New York Times mô tả là “có thể là cuốn tiểu thuyết AI đầu tiên đọc được ở mức tạm.” Những điểm thất bại của nó rất đáng chú ý. Trong Death of an Author có nhắc đến một cuốn tiểu thuyết làm bằng chứng cho âm mưu giết người, nhưng cuốn tiểu thuyết này lại lặp lại văn của chính Death of an Author – mô hình đã đạo văn chính cái tạo phẩm hư cấu mà nó đã tạo ra. Nhiều người mô tả trải nghiệm đọc là “trống rỗng về cảm xúc và thiếu sự gắn kết.” Phần lời bạt của chính Marche nói về chi phí không hề nhỏ để biên tập đưa đầu ra thô đến trạng thái xuất bản được. Đây không phải là giới hạn tạm thời của các mô hình hiện tại; đó là hệ quả cấu trúc của sự khác biệt giữa tái tạo mẫu và phán đoán trong điều kiện bất định.

Chi phí thứ ba là thứ khó đo lường nhất: suy giảm kỹ năng. Bằng chứng về việc suy giảm năng lực khi phụ thuộc vào AI đã xuất hiện ở nhiều ngành. Năm 2025, Budzyń và các cộng sự công bố trên The Lancet Gastroenterology & Hepatology bằng chứng lâm sàng thực tế đầu tiên về tình trạng mất kỹ năng do AI gây ra: mười chín bác sĩ nội soi có kinh nghiệm thực hiện các ca nội soi đại tràng không có AI sau một giai đoạn làm việc có hỗ trợ AI cho thấy tỷ lệ phát hiện polyp thấp hơn 6 điểm phần trăm so với trước – giảm 20% tương đối về hiệu suất chẩn đoán khi làm việc không có công cụ. Việc viết lách chắc chắn cũng ảnh hưởng tương tự. Các nhà nghiên cứu tại MIT Media Lab, nghiên cứu những người viết luận văn trong bốn tháng vào năm 2025, phát hiện rằng nhóm người tham gia sử dụng AI để viết cho thấy kết nối thần kinh yếu hơn nhóm người viết không có hỗ trợ, và nhóm người tham gia chuyển từ việc viết có hỗ trợ AI sang viết không có hỗ trợ vẫn thể hiện sự kết nối thần kinh yếu hơn những người đã viết không có hỗ trợ trong suốt quá trình. Việc ủy thác nhận thức dần làm suy giảm năng lực phán đoán độc lập chính xác là điều mà một biên tập viên phụ thuộc vào các lượt prompt AI để rà soát cấu trúc dễ bị tổn thương. AI thực hiện các lượt biên tập mà biên tập viên chỉ định. Chúng không làm điều mà biên tập viên không biết là cần thiết. Một biên tập viên có năng lực bị thoái hóa do dùng AI sẽ mất khả năng nhận thức các vấn đề mà AI đã bỏ sót – đó chính xác là tập hợp các vấn đề quyết định nhiều nhất liệu một cuốn tiểu thuyết có tốt hay không.

Kết luận về năng lực của AI

Hạn chế năng lực của AI – sau khi có deep research, RAG, multi- agent – không hề thay đổi. Không phải vì AI thiếu dữ liệu huấn luyện hay năng lực xử lý đủ, mà vì mỗi giai đoạn của một pipeline đa giai đoạn, và mỗi lần truy xuất RAG, đều được kích hoạt bởi một gợi nhắc hoặc một đầu ra trước đó. Không có giai đoạn pipeline nào chạy mà không có định hướng. Một cơ sở tri thức chỉ có thể chứa những gì đã được cố tình đưa vào đó. Một pipeline chỉ có thể chạy các lượt nó được thiết kế để chạy. Không có kiến trúc nào trong số này có thể giữ một quan sát chưa được giải quyết theo cách một nhà văn người ấp ủ nó – theo cách Kafka giữ, trong nhật ký của mình, những trang cảm thấy như có điều gì đó gần được nói nhưng chưa nói ra; theo cách Morrison giữ mảnh báo cắt về Margaret Garner cho đến khi bà hiểu hình thức tác phẩm mà nó đòi hỏi.

Những gì vẫn là của riêng con người trong việc viết tiểu thuyết không mang tính thần bí. Đó là sự sẵn lòng sống trong sự bất định, không biết hướng đi nào là đúng trong khoảng thời gian dài hơn một hệ thống được thiết kế để tạo ra đầu ra có xác suất cao nhất tiếp theo có thể duy trì.

Năm 2025, một nhóm nghiên cứu Cambridge đã khảo sát 258 nhà văn tiểu thuyết người Anh đã được xuất bản. Sáu mươi bảy phần trăm cho biết không bao giờ sử dụng AI. Ba mươi chín phần trăm nói rằng thu nhập của họ đã bị ảnh hưởng tiêu cực bởi AI tạo sinh. Năm mươi mốt phần trăm tin rằng AI sẽ có khả năng thay thế hoàn toàn công việc của họ.

Ba con số về cùng một nhóm người – lo sợ AI sẽ thay thế mình, nhưng lại không biết dùng AI. Các con số này là mô tả về một quá trình chuyển đổi đã bắt đầu nhưng chưa được giải quyết – và những hệ quả kinh tế của nó sẽ được bàn tới trong Phần 3 của Series.

Đọc thêm:

Dạng tiểu thuyết nào phù hợp nhất cho AI viết?

Tài liệu tham khảo

Karpinska, Monika et al. “Too Long, Didn’t Model: Decomposing LLM Long- Context Understanding With Novels.” arXiv 2505.14925, 2025. https://arxiv.org/abs/2505.14925
Liu, Nelson F. et al. “Lost in the Middle: How Language Models Use Long Contexts.” Transactions of the Association for Computational Linguistics, Vol. 12, 2024. https://arxiv.org/abs/2307.03172
Peeperkorn, Max et al. “Is Temperature the Creativity Parameter of Large Language Models?” ICCC 2024. arXiv 2405.00492. https://arxiv.org/pdf/2405.00492
Chakrabarty, Tuhin et al. “Art or Artifice? Large Language Models and the False Promise of Creativity.” CHI 2024. arXiv 2309.14556. https://arxiv.org/abs/2309.14556
Chakrabarty, Tuhin. Quoted in: Hutson, Matthew. “AI can make you more creative – but it has limits.” MIT Technology Review, July 12, 2024. https://www.technologyreview.com/2024/07/12/1094892/ai- can- make- you- more- creative- but- it- has- limits/
Wang et al. “SCORE: Story Coherence and Retrieval Enhancement for AI Narratives.” arXiv 2503.23512, 2025. https://arxiv.org/html/2503.23512v1
Huot, Florentine et al. “Agents’ Room: Narrative Generation through Multi- step Collaboration.” Google DeepMind. arXiv 2410.02603, 2024. https://arxiv.org/pdf/2410.02603
Tian et al. “Readers Prefer Outputs of AI Trained on Copyrighted Books over Expert Human Writers.” arXiv 2510.13939, 2025. https://arxiv.org/html/2510.13939v1
Doshi, Anil R. and Hauser, Oliver P. “Generative AI enhances individual creativity but reduces the collective diversity of novel content.” Science Advances, Vol. 10, 2024. https://www.science.org/doi/10.1126/sciadv.adn5290
Marche, Stephen (as “Aidan Marchine”). Death of an Author: A Novella. Pushkin Industries, 2023. https://www.goodreads.com/book/show/137182039- death- of- an- author
Budzyń, Marek et al. “Endoscopist deskilling risk after exposure to artificial intelligence in colonoscopy: a multicentre, observational study.” The Lancet Gastroenterology & Hepatology, Vol. 10, No. 10, pp. 896–903, 2025. https://www.eurekalert.org/news- releases/1094223
Kosmyna, Nataliya et al. “Your Brain on ChatGPT: Accumulation of Cognitive Debt when Using an AI Assistant for Essay Writing Task.” MIT Media Lab. arXiv 2506.08872, 2025. https://www.media.mit.edu/publications/your- brain- on- chatgpt/
Collett, Clementine. Survey of 332 UK literary creatives (258 published novelists, 42 publishing professionals, 32 literary agents), Cambridge Minderoo Centre for Technology and Democracy, Feb–May 2025. Reported via EurekAlert!, “Half of novelists believe AI is likely to replace their work entirely.” https://www.eurekalert.org/news- releases/1105954
Society of Authors / The Next Web. “4 in 10 translators are losing work to AI.” 2024. https://thenextweb.com/news/translators- losing- work- ai- machine- translation
Reedsy. “How Much Does It Cost to Hire a Ghostwriter?” 2024–2025. https://blog.reedsy.com/cost- to- hire- a- ghostwriter/
OpenAI. GPT- 4 Turbo announcement, OpenAI DevDay, November 6, 2023. https://openai.com/blog/new- models- and- developer- products- announced- at- devday

#AI#AI và tiểu thuyết gia#AI viết#nhà văn#sáng tác văn học#tiểu thuyết

Menu

A.I. và tiểu thuyết gia – Bạn hay thù? Phần 2: AI thực sự làm gì

Nguyễn Phương Mạnh

2.1 Bên trong cỗ máy: điều gì xảy ra khi bạn yêu cầu một LLM viết một chương

2.2 Những bước viết nào AI làm tốt, làm được, và làm kém?

2.3 AI hiện đang vượt trội hơn con người ở đâu – và trong điều kiện nào

2.4 Sử dụng AI có phải lúc nào cũng rẻ hơn thuê nhà văn người?

Kết luận về năng lực của AI

Tài liệu tham khảo

Lê Ái

Nguyễn Phương Mạnh

Nguyễn Phương Mạnh

Nguyễn Phương Mạnh

Lê Nam

Những bài nổi bật

Về những kẻ thất bại và người hùng bi kịch

Book Hunter

Triển vọng kinh tế cho thế hệ con cháu chúng ta – John Maynard Keynes

Chu Huyền

Aristotle có thể dạy chúng ta điều gì về sự tương giao

Vũ Phương Thảo

Những căn nguyên tiến bộ của thế kỷ XX

Minh Tân

Kéo hàn lâm gần văn hóa đại chúng hay nâng đại chúng gần tri thức hàn lâm?

Hà Thủy Nguyên

Đối thoại của Krishnamurti và David Bohm về nguồn gốc của sự xung đột tâm lý

Hà Thủy Nguyên

Menu

Bình luận

Viết nhận xét Hủy

2.1 Bên trong cỗ máy: điều gì xảy ra khi bạn yêu cầu một LLM viết một chương

2.2 Những bước viết nào AI làm tốt, làm được, và làm kém?

2.3 AI hiện đang vượt trội hơn con người ở đâu – và trong điều kiện nào

2.4 Sử dụng AI có phải lúc nào cũng rẻ hơn thuê nhà văn người?

Kết luận về năng lực của AI

Tài liệu tham khảo

Các bài viết liên quan

Những bài nổi bật