Lĩnh vực AI đang thay đổi nhanh chóng. Hãy tham khảo bảng thuật ngữ này để luôn cập nhật thông tin.
AI đang nhanh chóng thay đổi thế giới xung quanh chúng ta. Nó đang loại bỏ việc làm và làm ngập lụt internet với nội dung kém chất lượng. Nhờ sự phổ biến rộng rãi của ChatGPT đến việc Google nhồi nhét các bản tóm tắt AI lên đầu kết quả tìm kiếm của mình, AI đang hoàn toàn chiếm lĩnh internet. Với AI, bạn có thể nhận được câu trả lời tức thì cho hầu hết mọi câu hỏi. Cảm giác như đang nói chuyện với một người có bằng tiến sĩ về mọi lĩnh vực.
Nhưng khía cạnh đó của chatbot AI chỉ là một phần của bức tranh AI rộng lớn. Chắc chắn, việc có ChatGPT giúp làm bài tập về nhà hay có Midjourney tạo ra những hình ảnh robot thú vị dựa trên quốc gia xuất xứ thì rất tuyệt, nhưng tiềm năng của AI tạo sinh có thể định hình lại hoàn toàn các nền kinh tế. Điều đó có thể mang lại giá trị 4,4 nghìn tỷ USD cho nền kinh tế toàn cầu hàng năm, theo Viện Toàn cầu McKinsey, đó là lý do tại sao bạn nên mong đợi nghe nhiều hơn nữa về trí tuệ nhân tạo.
Nó xuất hiện trong vô số sản phẩm – một danh sách ngắn gọn bao gồm Gemini của Google, Copilot của Microsoft, Claude của Anthropic và công cụ tìm kiếm Perplexity. Bạn có thể đọc các bài đánh giá, đánh giá thực tế về những sản phẩm này và các sản phẩm khác, cùng với tin tức, bài giải thích và bài hướng dẫn tại trung tâm AI Atlas của chúng tôi.
Khi mọi người ngày càng quen thuộc hơn với một thế giới gắn liền với AI, các thuật ngữ mới đang xuất hiện ở khắp mọi nơi. Vì vậy, cho dù bạn đang cố gắng thể hiện sự thông minh trong các buổi gặp gỡ hay gây ấn tượng trong buổi phỏng vấn xin việc, đây là một số thuật ngữ AI quan trọng mà bạn nên biết.
Thuật ngữ này được cập nhật thường xuyên.
trí tuệ nhân tạo tổng quát, hay AGI: Một khái niệm gợi ý về một phiên bản AI tiên tiến hơn so với những gì chúng ta biết ngày nay, có thể thực hiện các tác vụ tốt hơn nhiều so với con người, đồng thời tự học hỏi và phát triển khả năng của mình.
agentive: Các hệ thống hoặc mô hình thể hiện khả năng tự chủ với khả năng tự động thực hiện các hành động để đạt được mục tiêu. Trong bối cảnh AI, một mô hình agentive có thể hành động mà không cần giám sát liên tục, chẳng hạn như một chiếc ô tô tự lái cấp cao. Không giống như một khung "agentic" (có tính tác nhân) hoạt động ngầm, các khung agentive (có khả năng tự chủ) hoạt động ở giao diện, tập trung vào trải nghiệm người dùng.
đạo đức AI: Các nguyên tắc nhằm ngăn chặn AI gây hại cho con người, đạt được thông qua các phương tiện như xác định cách hệ thống AI nên thu thập dữ liệu hoặc xử lý sự thiên vị.
an toàn AI: Một lĩnh vực liên ngành quan tâm đến tác động dài hạn của AI và cách nó có thể đột ngột tiến tới một siêu trí tuệ có khả năng thù địch với con người.
thuật toán: Một chuỗi các hướng dẫn cho phép một chương trình máy tính học hỏi và phân tích dữ liệu theo một cách cụ thể, chẳng hạn như nhận diện các mẫu, để từ đó học hỏi và hoàn thành các tác vụ một cách độc lập.
căn chỉnh (alignment): Điều chỉnh một AI để tạo ra kết quả mong muốn tốt hơn. Điều này có thể đề cập đến bất cứ điều gì, từ kiểm duyệt nội dung đến duy trì các tương tác tích cực với con người.
nhân cách hóa: Khi con người có xu hướng gán các đặc điểm giống con người cho các vật thể không phải con người. Trong AI, điều này có thể bao gồm việc tin rằng một chatbot giống con người và có nhận thức hơn so với thực tế, chẳng hạn như tin rằng nó vui, buồn hoặc thậm chí có tri giác.
trí tuệ nhân tạo, hay AI: Việc sử dụng công nghệ để mô phỏng trí tuệ con người, dù là trong các chương trình máy tính hay robot. Một lĩnh vực trong khoa học máy tính nhằm mục đích xây dựng các hệ thống có thể thực hiện các tác vụ của con người.
tác nhân tự chủ (autonomous agents): Một mô hình AI có khả năng, lập trình và các công cụ khác để hoàn thành một nhiệm vụ cụ thể. Ví dụ, một chiếc xe tự lái là một tác nhân tự chủ vì nó có các đầu vào cảm biến, GPS và thuật toán lái xe để tự điều hướng trên đường. Các nhà nghiên cứu của Stanford đã chỉ ra rằng các tác nhân tự chủ có thể phát triển văn hóa, truyền thống và ngôn ngữ chung của riêng mình.
thiên vị: Đối với các mô hình ngôn ngữ lớn, đây là lỗi phát sinh từ dữ liệu huấn luyện. Điều này có thể dẫn đến việc gán sai các đặc điểm nhất định cho các chủng tộc hoặc nhóm cụ thể dựa trên định kiến.
chatbot: Một chương trình giao tiếp với con người thông qua văn bản mô phỏng ngôn ngữ của con người.
ChatGPT: Một chatbot AI được phát triển bởi OpenAI sử dụng công nghệ mô hình ngôn ngữ lớn.
tính toán nhận thức (cognitive computing): Một thuật ngữ khác cho trí tuệ nhân tạo.
tăng cường dữ liệu (data augmentation): Trộn lại dữ liệu hiện có hoặc thêm một tập dữ liệu đa dạng hơn để huấn luyện AI.
tập dữ liệu (dataset): Một bộ sưu tập thông tin kỹ thuật số được sử dụng để huấn luyện, kiểm tra và xác thực một mô hình AI.
học sâu (deep learning): Một phương pháp AI, và một lĩnh vực con của học máy, sử dụng nhiều tham số để nhận diện các mẫu phức tạp trong hình ảnh, âm thanh và văn bản. Quá trình này được lấy cảm hứng từ bộ não con người và sử dụng mạng nơ-ron nhân tạo để tạo ra các mẫu.
khuếch tán (diffusion): Một phương pháp học máy lấy một mảnh dữ liệu hiện có, như một bức ảnh, và thêm nhiễu ngẫu nhiên. Các mô hình khuếch tán huấn luyện mạng lưới của chúng để tái tạo hoặc khôi phục bức ảnh đó.
hành vi xuất hiện (emergent behavior): Khi một mô hình AI thể hiện những khả năng không mong muốn.
học từ đầu đến cuối (end-to-end learning, hay E2E): Một quy trình học sâu trong đó một mô hình được hướng dẫn thực hiện một tác vụ từ đầu đến cuối. Nó không được huấn luyện để hoàn thành một tác vụ theo trình tự mà thay vào đó học từ các đầu vào và giải quyết tất cả cùng một lúc.
cân nhắc đạo đức: Nhận thức về các hàm ý đạo đức của AI và các vấn đề liên quan đến quyền riêng tư, sử dụng dữ liệu, sự công bằng, lạm dụng và các vấn đề an toàn khác.
foom: Còn được gọi là cất cánh nhanh (fast takeoff) hoặc cất cánh cứng (hard takeoff). Khái niệm cho rằng nếu ai đó xây dựng một AGI, có thể đã quá muộn để cứu nhân loại.
mạng đối kháng tạo sinh, hay GANs: Một mô hình AI tạo sinh bao gồm hai mạng nơ-ron để tạo dữ liệu mới: một bộ tạo (generator) và một bộ phân biệt (discriminator). Bộ tạo tạo ra nội dung mới, và bộ phân biệt kiểm tra xem nội dung đó có xác thực hay không.
AI tạo sinh (generative AI): Một công nghệ tạo nội dung sử dụng AI để tạo văn bản, video, mã máy tính hoặc hình ảnh. AI được cung cấp một lượng lớn dữ liệu huấn luyện, tìm thấy các mẫu để tạo ra các phản hồi mới lạ của riêng nó, đôi khi có thể tương tự như tài liệu nguồn.
Google Gemini: Một chatbot AI của Google hoạt động tương tự như ChatGPT nhưng cũng lấy thông tin từ các dịch vụ khác của Google, như Tìm kiếm và Bản đồ.
rào chắn bảo vệ (guardrails): Các chính sách và hạn chế được đặt ra cho các mô hình AI để đảm bảo dữ liệu được xử lý có trách nhiệm và mô hình không tạo ra nội dung gây khó chịu.
ảo giác (hallucination): Một phản hồi không chính xác từ AI. Có thể bao gồm AI tạo sinh tạo ra các câu trả lời sai nhưng được khẳng định một cách tự tin như thể đúng. Lý do cho điều này không hoàn toàn được biết đến. Ví dụ, khi hỏi một chatbot AI, "Leonardo da Vinci vẽ bức Mona Lisa khi nào?" nó có thể trả lời sai rằng, "Leonardo da Vinci đã vẽ Mona Lisa vào năm 1815," tức là 300 năm sau khi bức tranh thực sự được vẽ.
suy luận (inference): Quá trình các mô hình AI sử dụng để tạo văn bản, hình ảnh và nội dung khác về dữ liệu mới, bằng cách suy luận từ dữ liệu huấn luyện của chúng.
mô hình ngôn ngữ lớn, hay LLM: Một mô hình AI được huấn luyện trên lượng lớn dữ liệu văn bản để hiểu ngôn ngữ và tạo ra nội dung mới lạ bằng ngôn ngữ giống con người.
độ trễ (latency): Thời gian trễ từ khi một hệ thống AI nhận được đầu vào hoặc lời nhắc (prompt) và tạo ra đầu ra.
học máy, hay ML: Một thành phần trong AI cho phép máy tính học hỏi và đưa ra các kết quả dự đoán tốt hơn mà không cần lập trình rõ ràng. Có thể kết hợp với các tập huấn luyện để tạo ra nội dung mới.
Microsoft Bing: Một công cụ tìm kiếm của Microsoft hiện có thể sử dụng công nghệ cung cấp năng lượng cho ChatGPT để đưa ra kết quả tìm kiếm được hỗ trợ bởi AI. Nó tương tự như Google Gemini ở chỗ được kết nối với internet.
AI đa phương thức (multimodal AI): Một loại AI có thể xử lý nhiều loại đầu vào, bao gồm văn bản, hình ảnh, video và lời nói.
xử lý ngôn ngữ tự nhiên: Một nhánh của AI sử dụng học máy và học sâu để cung cấp cho máy tính khả năng hiểu ngôn ngữ con người, thường sử dụng các thuật toán học, mô hình thống kê và quy tắc ngôn ngữ.
mạng nơ-ron (neural network): Một mô hình tính toán giống cấu trúc bộ não con người và được dùng để nhận diện các mẫu trong dữ liệu. Bao gồm các nút hoặc nơ-ron liên kết với nhau, có thể nhận diện các mẫu và học hỏi theo thời gian.
trọng số mở (open weights): Khi một công ty phát hành một mô hình trọng số mở, các trọng số cuối cùng của mô hình – cách nó diễn giải thông tin từ dữ liệu huấn luyện, bao gồm cả các thiên vị – được công khai. Các mô hình trọng số mở thường có sẵn để tải xuống và chạy cục bộ trên thiết bị của bạn.
quá khớp (overfitting): Lỗi trong học máy khi mô hình hoạt động quá sát với dữ liệu huấn luyện và có thể chỉ nhận diện được các ví dụ cụ thể trong dữ liệu đó, nhưng không phải dữ liệu mới.
kẹp giấy (paperclips): Thuyết Paperclip Maximiser (tối đa hóa kẹp giấy), được đặt ra bởi nhà triết học Nick Boström của Đại học Oxford, là một kịch bản giả định trong đó một hệ thống AI sẽ tạo ra càng nhiều kẹp giấy theo nghĩa đen càng tốt. Với mục tiêu tạo ra số lượng kẹp giấy tối đa, một hệ thống AI theo giả thuyết sẽ tiêu thụ hoặc chuyển đổi tất cả các vật liệu để đạt được mục tiêu của mình. Điều này có thể bao gồm việc tháo dỡ các máy móc khác để sản xuất thêm kẹp giấy, những máy móc có thể hữu ích cho con người. Hậu quả không mong muốn của hệ thống AI này là nó có thể hủy diệt nhân loại trong mục tiêu tạo ra kẹp giấy.
tham số (parameters): Các giá trị số cung cấp cấu trúc và hành vi cho các LLM, cho phép chúng đưa ra dự đoán.
Perplexity: Tên của một chatbot và công cụ tìm kiếm được hỗ trợ bởi AI, thuộc sở hữu của Perplexity AI. Nó sử dụng một mô hình ngôn ngữ lớn, giống như những gì được tìm thấy trong các chatbot AI khác, nhưng có kết nối với internet mở để có kết quả cập nhật.
lời nhắc (prompt): Gợi ý hoặc câu hỏi bạn nhập vào một chatbot AI để nhận được phản hồi.
xích lời nhắc (prompt chaining): Khả năng của AI sử dụng thông tin từ các tương tác trước đó để định hình các phản hồi trong tương lai.
kỹ thuật prompt engineering: quá trình viết các lời nhắc (prompts) cho AI để đạt được kết quả mong muốn. Nó đòi hỏi các hướng dẫn chi tiết, kết hợp lời nhắc suy luận theo chuỗi (chain-of-thought prompting) và các kỹ thuật khác, bao gồm văn bản rất cụ thể. Kỹ thuật prompt engineering cũng có thể được sử dụng một cách độc hại để buộc các mô hình hành xử theo những cách mà chúng không được thiết kế ban đầu.
lượng tử hóa (quantization): Quá trình mà một mô hình học lớn AI được làm nhỏ hơn và hiệu quả hơn (mặc dù kém chính xác hơn một chút) bằng cách giảm độ chính xác của nó từ định dạng cao hơn xuống định dạng thấp hơn. Một cách hay để hình dung điều này là so sánh một hình ảnh 16 megapixel với một hình ảnh 8 megapixel. Cả hai đều rõ ràng và dễ nhìn, nhưng hình ảnh có độ phân giải cao hơn sẽ có nhiều chi tiết hơn khi bạn phóng to.
nội dung kém chất lượng (slop): nội dung trực tuyến chất lượng thấp được tạo ra với số lượng lớn bởi AI để thu hút lượt xem mà không tốn nhiều công sức hay nỗ lực. Mục tiêu của nội dung kém chất lượng AI, trong lĩnh vực Google Search và mạng xã hội, là làm ngập lụt các nguồn cấp dữ liệu với quá nhiều nội dung để thu được càng nhiều doanh thu quảng cáo càng tốt, thường là gây bất lợi cho các nhà xuất bản và người sáng tạo thực sự. Trong khi một số trang mạng xã hội chấp nhận sự tràn ngập của nội dung kém chất lượng AI, những trang khác lại đang chống lại.
vẹt ngẫu nhiên (stochastic parrot): Một phép so sánh về các LLM minh họa rằng phần mềm không có sự hiểu biết sâu sắc hơn về ý nghĩa đằng sau ngôn ngữ hay thế giới xung quanh nó, bất kể đầu ra nghe có vẻ thuyết phục đến mức nào. Cụm từ này đề cập đến việc một con vẹt có thể bắt chước lời nói của con người mà không hiểu ý nghĩa đằng sau chúng.
chuyển đổi phong cách (style transfer): Khả năng điều chỉnh phong cách của một hình ảnh sang nội dung của một hình ảnh khác, cho phép AI diễn giải các thuộc tính thị giác của một hình ảnh và sử dụng chúng trên một hình ảnh khác. Ví dụ, lấy bức chân dung tự họa của Rembrandt và tái tạo nó theo phong cách của Picasso.
dữ liệu tổng hợp (synthetic data): Dữ liệu được tạo ra bởi AI tạo sinh, không đến từ thế giới thực nhưng được huấn luyện trên dữ liệu thật. Nó được sử dụng để huấn luyện các mô hình toán học, ML và học sâu.
nhiệt độ (temperature): Các tham số được đặt để kiểm soát mức độ ngẫu nhiên của đầu ra của mô hình ngôn ngữ. Nhiệt độ cao hơn có nghĩa là mô hình chấp nhận nhiều rủi ro hơn.
tạo văn bản thành hình ảnh: Tạo hình ảnh dựa trên mô tả văn bản.
token: Các mẩu văn bản nhỏ mà các mô hình ngôn ngữ AI xử lý để hình thành phản hồi cho lời nhắc của bạn. Một token tương đương với bốn ký tự trong tiếng Anh, hoặc khoảng ba phần tư của một từ.
dữ liệu huấn luyện (training data): Các bộ dữ liệu được sử dụng để giúp các mô hình AI học hỏi, bao gồm văn bản, hình ảnh, mã hoặc dữ liệu.
mô hình Transformer: Một kiến trúc mạng nơ-ron và mô hình học sâu học bối cảnh bằng cách theo dõi các mối quan hệ trong dữ liệu, như trong câu hoặc các phần của hình ảnh. Vì vậy, thay vì phân tích một câu từng từ một, nó có thể xem xét toàn bộ câu và hiểu bối cảnh.
kiểm tra Turing: Được đặt theo tên nhà toán học và khoa học máy tính nổi tiếng Alan Turing, nó kiểm tra khả năng của một cỗ máy để hành xử giống con người. Cỗ máy vượt qua bài kiểm tra nếu một người không thể phân biệt được phản hồi của cỗ máy với phản hồi của một người khác.
học không giám sát (unsupervised learning): Một dạng học máy trong đó dữ liệu huấn luyện được gắn nhãn không được cung cấp cho mô hình và thay vào đó, mô hình phải tự nhận diện các mẫu trong dữ liệu.
AI yếu, hay AI hẹp: AI tập trung vào một nhiệm vụ cụ thể và không thể học hỏi ngoài bộ kỹ năng của nó. Hầu hết AI ngày nay là AI yếu.
học zero-shot (zero-shot learning): Một bài kiểm tra trong đó một mô hình phải hoàn thành một nhiệm vụ mà không được cung cấp dữ liệu huấn luyện cần thiết. Một ví dụ sẽ là nhận diện một con sư tử trong khi chỉ được huấn luyện về hổ.