Vài
nhận xét về máy dịch Google (Google Translate)
14/12/2020
http://vanviet.info/nghien-cuu-phe-binh/vi-nhan-xt-ve-my-dich-google-google-translate/
rần Ngọc Cư
Google Translate được định
nghĩa “là một dịch vụ dịch máy nhanh nhạy đa ngôn ngữ miễn phí do Google phát
triển, để dịch văn bản và trang web từ ngôn ngữ này sang ngôn ngữ khác”
(Wikipedia).
“Dịch vụ dịch máy” này
ngày càng được cải tiến và trở nên tinh vi hơn đến nỗi nhiều người nghĩ rằng nó
có thể thay thế một dịch giả chuyên nghiệp. Tuy nhiên, nếu có thì giờ ngồi vọc
chơi với Google Translate vài giờ, chúng ta có thể dễ dàng có những nhận xét
sau đây:
(1) Máy chỉ dịch “từ theo từ” (word for word
translation), thông thường với độ
chính xác khá cao, nhưng có một tần suất không thể bỏ qua là máy không dịch
đúng với nghĩa trong văn cảnh (contextual meaning). Nó sẵn sàng dịch “cây gạo”
là “rice plant” thay vì dịch là “silk-cotton tree; red silk-cotton; red cotton
tree; silk-cotton”, chẳng hạn.
Hàng chục cụm từ chuyển mạch
như that said, that being said (tuy vậy), after all (dẫu sao), to be sure (tuy
vậy), cấu trúc “For all the…” (bất chấp/mặc dù), chẳng hạn, đều bị dịch “word
for word”.
Đầu vào: “For all the
efforts he made for re-election, Trump ended up as a political loser.”
Đầu ra: “Đối với tất cả
những nỗ lực mà ông ấy đã thực hiện để tái đắc cử, Trump cuối cùng đã trở thành
một kẻ thất bại chính trị.”
(Câu này đáng lẽ phải dịch:
“Mặc dù với [Bất chấp] tất cả nỗ lực mà ông thể hiện để tái đắc cử, Trump cuối
cuối cùng đã trở thành một kẻ thất bại chính tri.”)
Khi đi bác sĩ, bạn có thể
được hỏi, “Are you allergic to anything?” (Anh có bị dị ứng gì không?” Nếu muốn
trả lời “không” theo kinh nghiệm của mình, bạn sẽ nói, “Not that I know of.” Ta
thử cho câu này vào máy nhé!
Đầu vào: “Not that I know
of.”
Đầu ra: “Không phải là
tôi biết.”
Đây là một câu rất thông
thường nhưng Google Translate vẫn còn dịch sai. “Not that I know of.” phải dịch:
“Theo chỗ tôi biết thì không.”
(2) Tác động của Google Translate lên từ vựng tiếng
Việt:
Qua thời gian, tuy nhiên,
một số từ vựng cài đặt trong Google Translate đã được người sử dụng đưa vào thị
trường chữ nghĩa và giúp chúng trở thành phổ biến rộng rãi dù có khi được dùng
sai nghĩa. Hoặc theo chiều ngược lại, người lập trình chọn cách dùng phổ biến
nhất. Tuy nhiên, trong lãnh vực ngôn ngữ, một từ được dùng sai lâu ngày vẫn có
thể được chấp nhận là chuẩn mực, theo giả thuyết cho rằng sự phát triển của
ngôn ngữ có tính võ đoán (the development of language is arbitrary.)
Chúng tôi ghi nhận một
vài trường hợp trong đó có lẽ nhờ máy dịch mà một số từ đã trở nên thông dụng
và đang trên con đường trở thành chuẩn mực. Để làm ví dụ, chúng tôi chú ý đến từ elites và
từ certain. Thứ nhất, hễ máy gặp từ elites thì nó
sẽ tự động dịch ngay là “giới tinh hoa”. Hai chữ tinh hoa gợi
lên trong trí óc người đọc một tầng lớp được chọn lọc vào vị trí lãnh đạo nhờ
tài năng và đức hạnh, do đó được người đời kính nể. Nhưng, elites còn
có nghĩa là “giới chóp bu,” vì thế các tác giả trong thế giới tiếng Anh, chẳng
hạn, thường dùng từ elites để chỉ giới lãnh đạo hay giai cấp
thống trị nói chung thậm chí kể cả ở các nước độc tài mà các lãnh đạo có thể có
những hành động tàn bạo và gian ác. Trong trường hợp này, thiết tưởng ta nên chọn
“giới chóp bu” để dịch elites. Nói cách khác, elites có
thể dịch hoặc là “giới tinh hoa” hoặc là “giới chóp bu”, nhưng máy dịch luôn chọn
“giới tinh hoa”.
Một ví dụ khác: Không biết
do từ nguồn gốc nào, từ ngoài xã hội hay do người lập trình cài đặt từ vựng vào
máy, hễ gặp từ certain thì máy liền dịch là “nhất định”(sure;
having no doubt). Và từ này đã tìm đường đi vào báo chí trong nước, chẳng hạn với
những câu như “Các nỗ lực cứu hộ gặp phải một số hạn chế nhất định.”
Nhưng certain còn có nghĩa như “some” khi một điều gì đó không
được biết đến hay không được mô tả rõ ràng, trong trường hợp này thiết tưởng phải
dịch là “nào đó” mới đúng. “A Certain Smile,” tên của một cuốn phim dựa trên
tác phẩm “Un certain sourire” của François Sagan, nếu cho vào máy, sẽ được dịch
ngay là “Một nụ cười nhất định”. Thiển nghĩ phải dịch là “Một nụ cười nào đó” mới
có ý nghĩa. Nói cách khác, certain có thể dịch hoặc là “nhất định”
hoặc là “nào đó”, nhưng máy dịch luôn luôn chọn “nhất định”.
Có lẽ do người lập trình
có lập trường chính trị, đôi khi Google Translate tỏ ra biết chọn từ ngữ một
cách rất phải đạo chính trị (in a politically correct fashion). Người sử dụng
không khỏi buồn cười khi thấy máy dịch đặt chữ “ông” trước một số tên và gọi trổng
đối với một số tên khác. Chẳng hạn, “Trump” không có chữ ông đứng trước, nhưng
máy lại dịch “Xi” thành “ông Tập”. Ta thử so sánh cặp ví dụ sau đây:
Nếu đầu vào là: “Donald
Trump has married three times. Trump now has five children.”
Đầu ra sẽ là: “Donald
Trump đã kết hôn ba lần. Trump hiện có năm người con.”
Nhưng nếu đầu vào là: “Xi
Jinping is the President of the People’s Republic of China. Xi is going to
Hanoi next month.” [Nhớ chấm câu].
Đầu ra sẽ là: Tập Cận
Bình là Chủ tịch nước Cộng hòa Nhân dân Trung Hoa. Ông Tập sẽ đến Hà Nội vào
tháng tới.
Tò mò hơn một chút, tôi
mượn hai câu này từ cuốn Mass Mobilization in the Democratic Republic
of Vietnam, 1945–1960 của Alec Holcombe và cho vào máy dịch:
“Immediately after its
founding by Hồ Chí Minh in September 1945, the Democratic Republic of Vietnam
(DRV) faced challenges from rival Vietnamese political organizations and from a
France determined to rebuild her empire after the humiliations of WWII. Hồ,
with strategic genius, courageous maneuver, and good fortune, was able to delay
full-scale war with France for sixteen months in the northern half of the
country.”
Kết quả là:
“Ngay sau khi được Hồ Chí
Minh thành lập vào tháng 9 năm 1945, Việt Nam Dân chủ Cộng hòa (VNDCCH) đã phải
đối mặt với những thách thức từ các tổ chức chính trị đối thủ của Việt Nam và từ
một nước Pháp quyết tâm xây dựng lại đế chế của mình sau những nhục nhã của Thế
chiến thứ hai. Hồ, với thiên tài chiến lược, tài thao lược dũng cảm và tài giỏi,
đã có thể trì hoãn cuộc chiến toàn diện với Pháp trong mười sáu tháng ở nửa
phía Bắc của đất nước ”.
Google Translate không dịch Hồ thành
“ông Hồ.” Điều này cho ta cảm tưởng có yếu tố Trung Quốc trong đó.
(3) Google Translate cực kỳ yếu kém khi đụng đến
thành ngữ (idioms), tiếng lóng (slangs). Ta thử xem qua vài ví dụ về idioms:
Đầu vào: "He knocked
her up and left her.”
Đầu ra: “Anh ấy hất cô ấy
lên và bỏ mặc cô ấy". (Sai. Knock up = cho mang bầu. Câu này phải dịch:
“Anh ấy cho cô ấy mang bầu rồi quất ngựa truy phong.”)
Đầu vào: “Donald Trump
Jr.’s ‘Radicle’ Typo Has Twitter Users In Stitches.”
Đầu ra: “Typo ‘Radicle’ của
Donald Trump Jr. có người dùng Twitter trong các lần cắt.” (Sai. In stitches =
cười bể bụng. Câu này phải dịch: “Lỗi đánh máy ‘Radicle’ của Donald Trump, Jr.
đã làm người sử dụng Twitter cười bể bụng.”)
(4) Về ngữ pháp, Google Translate xử lý tốt những mẫu
câu thông dụng, hiện hành, phù hợp với ngôn ngữ báo chí, thương mại, khoa học kỹ
thuật. Nhưng khi gặp những cấu
trúc cú pháp (syntactical structures) văn chương xưa, nó rất dễ dịch sai lạc,
như trong trường hợp chữ “but” làm liên đại danh từ (relative pronoun) chẳng hạn,
but = mà không. Ví dụ:
Đầu vào: “There is no
mother but loves her children.”
Đầu ra của máy dịch: “Có
mẹ nào mà thương con.”
(Máy đã dịch phản nghĩa.
Câu trên tương đương với: “There is no mother that doesn’t love her children.”
= “Có mẹ nào mà không thương con mình.”)
Ở trên, tôi nói “Google
Translate vẫn còn dịch sai” với ngụ ý máy dịch đang được chỉnh sửa, cải tiến
không ngừng. Có thể trong một hai, giờ nữa nó sẽ dịch đúng những câu tôi đem ra
làm ví dụ ở trên. Đã qua rồi cái thời nó dịch “The Universe in a Nutshell” là
“Vũ trụ trong một hạt dẻ.”
Cứ lẽ thường, trừ thơ văn
xưa ra, Google Translate trong trình trạng hiện nay đã giúp ích chúng ta rất
nhiều trong việc đọc hiểu các bản tin, dịch các bản văn trong các bộ môn khoa học
kỹ thuật và khoa học nhân văn nếu chúng ta có một trình độ tiếng Anh đủ nhận biết
chỗ nào máy đã dịch sai. Nếu không có trình độ đó, nhiều khi đoạn văn dịch của
Google Translate vẫn nghe rất suôn sẻ, thậm chí có vẻ văn chương, nhưng nó đã
nói ngược lại điều tác giả muốn nói.
No comments:
Post a Comment