Họ không muốn âm thanh "bình tĩnh, vững chắc và an toàn" của ChatGPT bị im bặt
Giọng nói mà mọi người đã quen thuộc với ChatGPT sẽ bị ngừng vào ngày 9 tháng 9, và không phải ai cũng hài lòng về điều đó. Giọng nói "Standard" của ChatGPT sẽ bị loại bỏ để ưu tiên tùy chọn giọng nói "Advanced" được phát hành lần đầu cho một số lượng người dùng ChatGPT giới hạn vào năm ngoái. Giờ đây được đổi tên đơn giản thành "Giọng nói ChatGPT", đây sẽ là lựa chọn duy nhất trong tương lai.
Chế độ giọng nói "Standard" ban đầu ra mắt vào năm 2023, được xây dựng dựa trên một quy trình đơn giản: bạn nói, máy chủ của OpenAI sẽ phiên âm đầu vào của bạn, tạo ra phản hồi bằng mô hình GPT, sau đó đọc lại bằng một giọng nói tổng hợp tương đối trung tính.
Chế độ giọng nói Advanced của ChatGPT được thiết kế để phản hồi nhanh hơn, có giọng điệu và cách nói chuyện giống con người hơn, và nhìn chung hoạt động ở mức độ cao hơn so với phiên bản tiền nhiệm. Tuy nhiên, rất nhiều người cho rằng đây là một sai lầm.
"Giọng nói standard mang lại sự ấm áp, chiều sâu và kết nối tự nhiên mà giọng nói advanced đơn giản là không thể sánh bằng," một người dùng đã viết trong một bài đăng trên diễn đàn của OpenAI. "Giọng nói advanced nghe có vẻ robot và tách rời, thiếu đi cái hồn và giọng điệu thấu hiểu mà tôi trân trọng."
Hơn một người đã mô tả giọng nói mới là kém hấp dẫn khi trò chuyện. Cũng có những lời phàn nàn rằng mô hình mới nói quá nhanh, như thể nó đang cố gắng kết thúc cuộc tương tác.
"Giọng nói Standard trầm tư và có một giọng điệu tự nhiên, dễ chịu. Xúc động," một người dùng Reddit đã đăng. "Giọng nói Advanced không có những đặc điểm tương tự, không đưa ra câu trả lời sâu sắc, có giới hạn nội dung nghiêm ngặt và luôn có vẻ như đang cố gắng vội vã đưa ra một phản hồi tầm thường."
Ngay cả khi bạn không bận tâm về âm thanh của giọng nói mới, một số người dùng ChatGPT vẫn khó chịu vì họ phát hiện ra rằng nó thậm chí không hoạt động giống như giọng nói trước đây.
Chế độ giọng nói Advanced tích hợp giọng nói của bạn, các phản hồi của AI và biểu cảm giọng nói của nó trong một quy trình thời gian thực. Quy trình tích hợp này có nghĩa là AI không trích dẫn nguyên văn phản hồi đã viết. Thay vào đó, nó thể hiện ý tưởng một cách đàm thoại hơn, đôi khi bỏ qua các cụm từ, cô đọng các mệnh đề hoặc điều chỉnh giọng điệu dựa trên ngữ cảnh. Về mặt kỹ thuật thì ấn tượng, nhưng không phải là điều mà một số người dùng ChatGPT mong muốn.
"Giọng nói Standard sẽ đọc nguyên văn phản hồi mà ChatGPT thường đưa cho bạn. Nó là một đường dây trực tiếp, bạn hiểu không?" một bài đăng mẫu trên Reddit đã viết. "Nhưng cái mới này? Nó nghe như đang diễn giải lại hoặc tóm tắt thay vì vậy. Nó bỏ qua các chi tiết nhỏ và làm cho toàn bộ cuộc trò chuyện cảm thấy bị ngắt kết nối hơn nhiều."
Điều đó nghe có vẻ nhỏ nhặt trong bức tranh lớn về tiến bộ của AI, nhưng nó phản ánh một xu hướng rộng lớn hơn trong công nghệ nơi mọi người khó chịu khi có một thay đổi lớn, ngay cả khi đó rõ ràng là một bản nâng cấp.
Tất nhiên, không phải ai cũng không thích tùy chọn giọng nói mới. Một số người thích tính chân thực và tốc độ của nó, và cách nó tạo ra một cuộc trò chuyện trôi chảy hơn. OpenAI cũng đã hứa hẹn sẽ có thêm nhiều cải tiến nữa. Nhưng, với việc những phàn nàn về việc loại bỏ GPT-4o khi GPT-5 ra mắt đã dẫn đến sự trở lại của mô hình cũ, tôi sẽ không quá ngạc nhiên khi thấy Chế độ giọng nói Standard cũng có thể trở lại.