1: Công nghệ AI sản sinh ngôn tữ tự nhiên (Natural language generation)
Công nghệ AI sản sinh ngôn tữ tự nhiên (Natural language generation) hay NLG. NLG là một quá trình phần mềm tự động biến dữ liệu có cấu trúc thành văn bản dễ đọc cho con người1. NLG có thể giúp doanh nghiệp tạo ra hàng ngàn trang văn bản dựa trên dữ liệu chỉ trong vài phút. NLG cũng là một công nghệ trí tuệ nhân tạo (AI) có khả năng chuyển đổi dữ liệu thành từ, câu, bài viết và thậm chí cả kịch bản phim.
Một quá trình sản sinh văn bản tự động bao gồm 6 giai đoạn:
- Xác định nội dung: Quyết định nội dung chính sẽ được biểu diễn trong một câu hoặc thông tin cần đề cập trong văn bản.
- Giải thích dữ liệu: Dữ liệu được phân tích sẽ được giải thích. Nhờ vào các kỹ thuật học máy, các mẫu có thể được nhận diện trong dữ liệu được xử lý. Đây là nơi dữ liệu được đặt vào ngữ cảnh.
- Lập kế hoạch tài liệu: Các cấu trúc trong dữ liệu được tổ chức với mục tiêu tạo ra một cấu trúc kể chuyện và kế hoạch tài liệu.
- Tổng hợp câu: Nó còn được gọi là việc lập kế hoạch vi mô, và quá trình này liên quan đến việc chọn các biểu thức và từ trong mỗi câu cho người dùng cuối. Nói cách khác, đây là giai đoạn mà các câu khác nhau được tổng hợp theo ngữ cảnh vì sự liên quan của chúng.
- Lựa chọn từ vựng: Sử dụng các từ phù hợp để truyền đạt ý nghĩa rõ ràng.
- Biểu diễn văn bản: Tạo ra văn bản cuối cùng theo các quy tắc ngữ pháp, chính tả và phong cách.
2: Công nghệ AI nhận dạng giọng nói (Speech recognition)
Công nghệ AI nhận dạng giọng nói (Speech recognition) là một lĩnh vực con của Xử lý ngôn ngữ tự nhiên (Natural language processing, viết tắt là NLP) liên quan đến việc xác định và chuyển đổi các lệnh bằng giọng nói của con người thành dạng văn bản hoặc các hành động tương ứng. Nhận dạng giọng nói được sử dụng trong nhiều ứng dụng như trợ lý ảo, kiểm soát quyền truy cập, dịch máy, chuyển đổi giọng nói thành văn bản, v.v.
Công nghệ AI này có thể được phân loại theo hai tiêu chí: mục đích và phương pháp. Theo mục đích, nhận dạng giọng nói có thể là nhận dạng người nói (speaker recognition) hoặc nhận dạng từ ngữ (speech recognition). Nhận dạng người nói là quá trình xác minh danh tính của người nói dựa trên các đặc trưng sinh trắc học của giọng nói. Nhận dạng từ ngữ là quá trình xác định các từ được nói trong một đoạn âm thanh. Theo phương pháp, nhận dạng giọng nói có thể là phụ thuộc vào văn bản (text-dependent) hoặc không phụ thuộc vào văn bản (text-independent). Phương pháp phụ thuộc vào văn bản yêu cầu người nói phải sử dụng một số từ hoặc câu cố định để nhận dạng. Phương pháp không phụ thuộc vào văn bản cho phép người nói sử dụng bất kỳ từ hoặc câu nào để nhận dạng.
Một số ví dụ của nhận dạng giọng nói là:
- Gmail Smart Compose: Một tính năng của Gmail cho phép bạn nhập văn bản bằng giọng nói và gợi ý các câu trả lời ngắn.
- Amazon Echo: Một thiết bị thông minh có khả năng nhận và thực hiện các lệnh bằng giọng nói của người dùng, ví dụ như điều khiển các thiết bị trong nhà, chơi nhạc, tìm kiếm thông tin, v.v.
- Microsoft Word: Một ứng dụng soạn thảo văn bản có tính năng Dictate cho phép bạn nhập văn bản bằng giọng nói và sửa lỗi chính tả hoặc ngữ pháp.
3: Công nghệ AI trợ lý ảo (Virtual agent)
Trợ lý ảo (Virtual agent) là một ứng dụng lập trình hướng nhiệm vụ, nhận dạng giọng nói của con người và thực hiện các lệnh được phát âm bởi người dùng. Trợ lý ảo có thể được gọi với nhiều cái tên khác nhau như: Trợ lý kỹ thuật số, trợ lý giọng nói hay là trợ lý AI. Trợ lý ảo được xây dựng dựa trên công nghệ AI để thực hiện nhiệm vụ tự động hóa, trợ giúp trong quá trình làm việc hoặc hỗ trợ trong cuộc sống hàng ngày.
Trợ lý ảo có ứng dụng rất rộng rãi trong cuộc sống. Công nghệ AI này có thể xử lý một lượng lớn dữ liệu và thực hiện các tác vụ tự động, giúp tiết kiệm thời gian và nâng cao hiệu suất công việc. Trợ lý ảo cũng có thể học hỏi từ tương tác của người dùng để tùy chỉnh và cá nhân hóa dịch vụ, trở thành một trợ lý ảo cá nhân cho riêng người dùng. Trợ lý ảo còn có thể nhắc nhở bạn về các cuộc họp, hạn chót, ngày kỷ niệm, và thậm chí giúp bạn lên kế hoạch cho ngày hôm sau. Trợ lý ảo cũng có thể giải quyết những vấn đề phức tạp mà con người mất nhiều thời gian để giải quyết. Trợ lý ảo cũng có thể cải thiện chất lượng cuộc sống thông qua việc giảm stress, hỗ trợ sức khỏe tâm thần và thể chất, và thậm chí cung cấp giải trí.
Một số ví dụ về trợ lý ảo là:
- Siri của Apple: Đây là trợ lý ảo được tích hợp vào các thiết bị của Apple như iPhone, iPad, Macbook, Apple Watch, Apple TV, và HomePod. Siri có thể nhận diện giọng nói của người dùng và thực hiện các yêu cầu như gọi điện thoại, gửi tin nhắn, mở ứng dụng, chơi nhạc, tra cứu thời tiết, định hướng đường đi, và nhiều hơn nữa.
- Google Assistant của Google: Đây là trợ lý ảo được tích hợp vào các thiết bị chạy hệ điều hành Android và Chrome OS, cũng như các thiết bị thông minh của Google như Google Home, Nest Hub, Nest Audio, Nest Mini, và Pixel Buds. Google Assistant có thể nhận diện giọng nói và văn bản của người dùng và thực hiện các yêu cầu như tìm kiếm trên Google, lên lịch sự kiện, đặt báo thức, điều khiển thiết bị thông minh trong nhà, chơi trò chơi, dịch thuật, và nhiều hơn nữa.
- Alexa của Amazon: Đây là trợ lý ảo được tích hợp vào các thiết bị thông minh của Amazon như Echo, Echo Dot, Echo Show, Echo Studio, Echo Flex, Echo Buds, Fire TV, Fire Tablet, và Kindle. Alexa có thể nhận diện giọng nói của người dùng và thực hiện các yêu cầu như phát nhạc, tin tức, podcast, sách nói; đặt hàng trên Amazon; điều khiển thiết bị thông minh trong nhà; gọi điện thoại và gửi tin nhắn; tạo danh sách mua sắm; trả lời câu hỏi; và nhiều hơn nữa.
- Cortana của Microsoft: Đây là trợ lý ảo được tích hợp vào các thiết bị chạy hệ điều hành Windows 10 và Windows Phone 8.1; cũng như các thiết bị thông minh của Microsoft như Surface Headphones và Harman Kardon Invoke. Cortana có thể nhận diện giọng nói và văn bản của người dùng và thực hiện các yêu cầu như tìm kiếm trên Bing; lên lịch sự kiện; gửi email; tạo ghi chú; đặt nhắc nhở; đồng bộ hóa với các ứng dụng khác của Microsoft như Outlook, OneNote, Skype; và nhiều hơn nữa.
4: Công nghệ AI quản lý quyết định (Decision management)
Công nghệ AI quản lý quyết định (Decision management) là một lĩnh vực của trí tuệ nhân tạo (AI) có liên quan đến việc xây dựng các hệ thống phần mềm có khả năng hỗ trợ hoặc thay thế con người trong việc ra các quyết định dựa trên dữ liệu và luật lệ. Công nghệ AI quản lý quyết định có thể giúp doanh nghiệp cải thiện hiệu quả, chất lượng, tốc độ và tính nhất quán của các quyết định. Công nghệ AI quản lý quyết định cũng có thể giúp doanh nghiệp thích ứng với các thay đổi trong môi trường kinh doanh, khách hàng và cạnh tranh.
Một số ứng dụng của công nghệ AI quản lý quyết định là:
- Quản lý doanh nghiệp: Công nghệ AI quản lý quyết định có thể giúp doanh nghiệp tối ưu hóa các hoạt động kinh doanh như sản xuất, bán hàng, tiếp thị, tài chính, nhân sự, v.v. Công nghệ AI quản lý quyết định có thể giúp doanh nghiệp phân tích dữ liệu, dự báo xu hướng, đề xuất hành động, tự động hóa các quy trình và theo dõi kết quả. Một ví dụ về ứng dụng công nghệ AI trong quản lý doanh nghiệp là hệ thống hoạch định nguồn lực Enterprise Resources Planning - phần mềm ERP, giúp doanh nghiệp giải quyết những bài toán khó trong quá trình kinh doanh hiện nay.
- Quản lý thể thao: Công nghệ AI quản lý quyết định có thể giúp các đội thể thao cải thiện hiệu suất và việc ra quyết định. Công nghệ AI quản lý quyết định có thể giúp các đội thể thao thu thập và phân tích dữ liệu về các cầu thủ, đối thủ, chiến thuật, v.v. Công nghệ AI quản lý quyết định có thể giúp các đội thể thao lập chiến lược, điều chỉnh kế hoạch, phát hiện sai sót và tối ưu hóa hiệu suất. Một ví dụ về ứng dụng công nghệ AI trong quản lý thể thao là hệ thống Hawk-Eye, giúp trọng tài ra các quyết định chính xác trong các môn như bóng chuyền, bóng rổ, bóng bàn, v.v.
- Quản lý nhân sự: Công nghệ AI quản lý quyết định có thể giúp các tổ chức tuyển dụng, đào tạo, phát triển và giữ chân nhân viên. Công nghệ AI quản lý quyết định có thể giúp các tổ chức tìm kiếm và sàng lọc ứng viên phù hợp, kiểm tra và đánh giá kỹ năng, thiết kế và cung cấp các khóa học huấn luyện, theo dõi và phản hồi hiệu suất, khuyến khích và ghi nhận thành tích. Một ví dụ về ứng dụng công nghệ AI trong quản lý nhân sự là hệ thống JobTest, giúp các nhà tuyển dụng kiểm tra năng lực và tính cách của ứng viên thông qua các bài kiểm tra trực tuyến.
5: Công nghệ AI tạo hình ảnh từ văn bản (text to image)
Công nghệ AI chuyển văn bản thành hình ảnh (text to image) là một công nghệ sử dụng trí tuệ nhân tạo để tạo ra những hình ảnh từ những lời mô tả bằng văn bản. Công nghệ này có thể có nhiều ứng dụng trong lĩnh vực nghệ thuật, giáo dục, giải trí, y tế và nhiều lĩnh vực khác.
Công nghệ AI chuyển văn bản thành hình ảnh dựa trên các mô hình học sâu, thường là các mạng đối sinh (GANs), để hiểu ý nghĩa của văn bản và sinh ra hình ảnh phù hợp với nội dung và phong cách của văn bản. Các mô hình này được huấn luyện trên một lượng lớn dữ liệu gồm các cặp văn bản và hình ảnh, và được đánh giá dựa trên độ chính xác, độ phong phú và độ sáng tạo của hình ảnh được tạo ra.
Một số ví dụ về các công cụ AI chuyển văn bản thành hình ảnh tiếng Việt là:
- Dall-E: Một công cụ AI được phát triển bởi OpenAI, có thể tạo ra những hình ảnh độc đáo và sáng tạo từ những lời mô tả bằng tiếng Anh. Bạn có thể nhập những từ khóa hoặc cụm từ để miêu tả hình ảnh bạn muốn, và Dall-E sẽ sinh ra những hình ảnh phù hợp với nội dung và phong cách của bạn.
- Midjourney: Một công cụ AI chuyên nghiệp, cho phép bạn tạo ra những hình ảnh chất lượng cao từ những lời mô tả bằng tiếng Anh. Bạn có thể sử dụng Midjourney để tạo ra những hình ảnh cho các mục đích thương mại, giáo dục hoặc cá nhân. Bạn cũng có thể yêu cầu Midjourney chỉnh sửa hoặc cải thiện hình ảnh của bạn theo ý kiến của bạn.
- Canva: Một nền tảng thiết kế đồ họa trực tuyến, cho phép bạn biến chữ thành hình ảnh với trình tạo ảnh đẹp AI. Bạn có thể nhập lời mô tả bằng tiếng Anh để tạo ra những hình ảnh sống động, và áp dụng các tùy chọn phong cách khác nhau như Ảnh, Vẽ, Tranh, 3D, Họa tiết hoặc Concept art.
- Adobe Firefly: Một công cụ sáng tạo nội dung được hỗ trợ bởi Generative AI của Adobe, cho phép bạn thử nghiệm, tưởng tượng và tạo vô số hình ảnh với Firefly. Bạn có thể sử dụng lời nhắc bằng văn bản đơn giản với hơn 100 ngôn ngữ để tạo những hình ảnh tuyệt đẹp, chuyển đổi văn bản, sáng tạo với màu sắc, v.v.
Kết bài
Những công nghệ AI kể trên được sử dụng trí tuệ nhân tạo để mô phỏng các quá trình suy nghĩ và học tập của con người trên máy móc, đặc biệt là máy tính. Những công nghệ này có thể có nhiều ứng dụng trong lĩnh vực nghệ thuật, giáo dục, giải trí, y tế và nhiều lĩnh vực khác. Những công nghệ AI đang ngày càng phát triển và trở nên phổ biến hơn trong thời đại công nghệ số. Các bạn có thể đọc thêm bài viết (Trí tuệ nhân tạo và những điều cần biết) để hiểu thêm về nội dung này.