Tôi muốn AI cho phép tôi nhắn tin bằng giọng nói. Google Pixel 10 đã rất gần rồi

Tin tức AI - 12/12/2025 20:24:46

Tính năng nhập liệu bằng giọng nói nâng cao trên Pixel 10 sử dụng sức mạnh của AI để đọc chính xác tin nhắn văn bản, nhưng không phải lúc nào nó cũng hoạt động như mong đợi.

Khi len lỏi giữa đám đông ở New York, tôi không thể cúi đầu nhìn điện thoại để nhắn tin được. Các công cụ chuyển lời nói thành văn bản đã trở nên rất quan trọng để giao tiếp nhanh chóng khi đang cầm cả điện thoại thông minh và một chiếc bánh bò Jamaica. 

Vấn đề là đôi khi hệ thống hiểu sai từ, bỏ sót dấu câu hoặc dừng ghi âm hoàn toàn. Điều này khiến tôi phải dừng lại giữa dòng người đi bộ, nơi tôi cần quay lại và bắt đầu chỉnh sửa, loại bỏ mọi tiện ích mà tính năng chuyển lời nói thành văn bản mang lại. Thành thật mà nói, điều này có thể khắc phục được bằng AI, công nghệ đang thay đổi cách chúng ta mua sắm, duyệt web và đọc về sự ra đi của những người thân yêu, dù tốt hay xấu. 

Đã có một số tiến bộ. Google đã giới thiệu tính năng nhập liệu bằng giọng nói nâng cao vào đầu năm nay cho các chủ sở hữu Pixel 6 và các thiết bị mới hơn. Sau khi bật, bạn thực sự có thể chỉnh sửa văn bản bằng giọng nói của mình, và AI tích hợp sẵn sẽ có thể quay lại và sửa các từ bị nói sai. Ví dụ, nói "xóa từ cuối" sẽ xóa từ cuối cùng và nói "xóa" sẽ xóa câu cuối cùng. Đối với chủ sở hữu Pixel 8 trở lên, nói "sửa lỗi" sẽ hiển thị các gợi ý để cải thiện văn bản của bạn, với những thao tác chạm đơn giản sẽ làm sạch tin nhắn của bạn. Những người có điện thoại Pixel mới hơn cũng có thể ra lệnh bằng giọng nói cho thiết bị của mình để sắp xếp lại hoặc thay thế từ. Chủ sở hữu Pixel thậm chí có thể dạy AI thay đổi chính tả của tên, như đổi Christine thành Christyne. Chủ sở hữu Pixel 9 và 10 (trừ Pixel 9A, điều này khá kỳ lạ vì cả hai đều có cùng bộ xử lý và RAM) có thể sử dụng AI để kiểm tra lỗi chính tả, diễn đạt lại hoặc làm cho tin nhắn trang trọng hơn. 

Việc tìm hiểu tất cả các tính năng mới có thể mất một chút thời gian. Nhưng một khi đã quen thuộc, quá trình sử dụng chuyển giọng nói thành văn bản sẽ ít phức tạp hơn. Tuy nhiên, nó không hoạt động hoàn hảo và vẫn còn chỗ để cải thiện. 

Mặc dù các thiết bị Pixel không có bộ xử lý tiên tiến hay camera megapixel cao nhất, Google vẫn tạo sự khác biệt so với các đối thủ cạnh tranh như Samsung và Motorola nhờ sự hỗ trợ phần mềm mạnh mẽ, điều này càng được củng cố bởi AI. Điều thú vị là doanh số Pixel đang tăng trưởng nhanh chóng, nhưng công ty không nhất thiết muốn thống trị thị trường điện thoại thông minh trị giá gần 600 tỷ USD. Google đã thừa nhận điều này trong một cuộc phỏng vấn với Bloomberg vào đầu năm nay. Thay vào đó, chiến lược kinh doanh cốt lõi của Google hiện tập trung vào AI. Dù là Apple hay Samsung, cả hai đều (theo báo cáo) sẽ sử dụng Google Gemini. 

Mặc dù điện thoại Pixel có cấu hình khiêm tốn và xét đến sức mạnh của Google trong cuộc đua AI, nhưng hãng cần tìm cách để tính năng chuyển lời nói thành văn bản được hỗ trợ bởi AI hoạt động hiệu quả nhằm thể hiện những khả năng của công nghệ của mình, điều mà Google vẫn chưa làm được. Điều đó có nghĩa là Google phải chứng minh cho phần còn lại của ngành công nghiệp thấy rằng các giải pháp AI trên di động của họ là tốt nhất, và điện thoại Pixel của hãng thể hiện sự phát triển đó. Dưới đây là cách nó có thể hoạt động hiệu quả cho bạn.

Khi tính năng nhập liệu bằng giọng nói nâng cao hoạt động, nó thật tuyệt vời

Đó là điều khiến tính năng nhập liệu bằng giọng nói nâng cao trở nên khó đoán. Khi nó hoạt động, nó rất tuyệt. Nhưng số lần AI gặp khó khăn trong việc phân biệt giữa các từ dùng để nhắn tin và những từ cần sửa chữa là rất nhiều.

Sự ngẫu nhiên này thật kỳ lạ vì ứng dụng Gemini của Google trên chiếc Pixel 10 Pro Fold mẫu đánh giá của tôi dường như hiểu tôi rất tốt. Theo Google, sự khác biệt này là do điện thoại đang thực hiện phiên âm trên thiết bị, nghĩa là nó đang chạy một mô hình AI cục bộ nhỏ hơn. Rõ ràng, một mô hình AI nhỏ trên điện thoại không thể cạnh tranh với một trung tâm dữ liệu trị giá hàng tỷ đô la được sử dụng cho các mô hình dựa trên đám mây. Google cho biết họ đang thường xuyên phát hành các cải tiến.  

Thiếu dấu câu thực sự là một rắc rối

Tôi đã phải vật lộn với dấu câu trên các hệ thống chuyển lời nói thành văn bản cũ hơn, phải nói to các từ "dấu phẩy," "dấu chấm than," và "dấu chấm." Với tính năng nhập liệu bằng giọng nói nâng cao, nó tự động. Nhưng ngay cả tính năng này cũng có thể không ổn định.

Khi nó hoạt động, đó là một tiện lợi lớn, vì tôi không cần quay lại tin nhắn và thêm dấu câu. Tuy nhiên, khi nó không hoạt động, nó tạo ra một câu dài, khó đọc, câu ghép rất khó hiểu và khiến tôi trông cẩu thả. 

Đây có thể là yếu tố thay đổi cuộc chơi nếu Google làm đúng

Người tiêu dùng đã không mấy ấn tượng với làn sóng tính năng AI tràn ngập trên điện thoại của họ. Chắc chắn, chỉnh sửa ảnh nhanh hoặc viết lại email rất tiện lợi, nhưng thường thì các tính năng này chỉ mang tính bổ sung hơn là thay đổi.

Tôi cảm thấy rằng thường thì, khi người tiêu dùng nghĩ về AI, họ nghĩ đến TARS từ bộ phim Interstellar năm 2014 hoặc HAL 9000 trong 2001: A Space Odyssey năm 1968. Thông thường, các hệ thống AI mà chúng ta tương tác trên điện thoại chỉ là những cách nâng cao hơn để thực hiện những gì thiết bị của chúng ta đã làm bằng các phương tiện khác.

Để Google thực hiện đúng tính năng nhập liệu bằng giọng nói nâng cao, các mô hình cần có khả năng phân biệt ý định từ lời đọc một cách liền mạch. Không thể có sự đánh đổi liên tục khi nó chỉ hoạt động một nửa thời gian. Đối với hầu hết mọi người, nó sẽ chỉ là một sự phiền toái. Đối với tôi, nó sẽ kết thúc bằng một sự cố ẩm thực và chiếc bánh bò bị chuột đánh cắp.

Cách bật tính năng nhập liệu bằng giọng nói nâng cao trên Pixel

  1. Vào ứng dụng Tin nhắn.
  2. Nhấp vào bất kỳ liên hệ nào như thể bạn sắp bắt đầu nhắn tin.
  3. Chạm vào biểu tượng bốn ô vuông ở góc trái bàn phím.
  4. Chạm vào Cài đặt.
  5. Chạm vào Nhập liệu bằng giọng nói.
  6. Bật Tính năng nhập liệu bằng giọng nói nâng cao.

Lệnh thoại (Pixel 6 trở lên)

  • Để xóa từ cuối cùng, hãy nói: "Xóa từ cuối."
  • Để xóa câu cuối cùng, hãy nói: "Xóa."
  • Để xóa văn bản, hãy nói: "Xóa tất cả."
  • Để gửi tin nhắn, hãy nói: "Gửi."
  • Để điền vào trường trống tiếp theo trong biểu mẫu, hãy nói: "Tiếp theo."
  • Để thêm biểu tượng cảm xúc, hãy nói tên biểu tượng cảm xúc, ví dụ: "Biểu tượng mặt cười."
  • Để dừng nhập liệu bằng giọng nói, hãy nói: "Dừng lại." 

Cách sử dụng "sửa lỗi" (Pixel 8 trở lên, chỉ tiếng Anh, Mỹ)

  1. Sau khi bạn đọc chính tả một văn bản, hãy nói: "Sửa lỗi."
  2. Một cửa sổ bật lên sẽ xuất hiện, đưa ra gợi ý cho bạn.
  • Tính năng này có thể không hoạt động với tất cả mọi người.

Sử dụng AI để chỉnh sửa chi tiết, kiểm tra lỗi và viết lại (Pixel 8 trở lên, chỉ ở Mỹ)

  1. Nói một trong các lệnh dưới đây.
  2. Nó sẽ tự động, nhưng bạn có thể thấy nút Áp dụng.
  3. Sau khi chỉnh sửa, bạn cũng có thể nói "Hoàn tác" để quay lại lệnh.
  4. Xóa toàn bộ tin nhắn bằng cách nói: "Xóa tất cả."
  5. Tính năng này đang trong giai đoạn thử nghiệm và có thể không phải lúc nào cũng hoạt động. 

Các lệnh:

Các lệnh nhập liệu bằng giọng nói nâng cao cho thiết bị Google Pixel. Google
Nguồn: cnet.com

Tin tức AI

Xem tất cả