Tác giả: Lexie
Biên tập: Lữ
Trong cuộc thảo luận lớn về AI, vai trò mà người ta gán cho nó là trợ thủ đắc lực và hiệu quả nhất của chúng ta, hoặc chính “đội quân máy móc” sẽ lật đổ chúng ta Dù là kẻ thù hay bạn bè, AI không chỉ có khả năng. Để hoàn thành những nhiệm vụ do con người giao, bạn cũng cần có khả năng “đọc” được lòng người, và khả năng đọc được suy nghĩ này cũng chính là điểm nhấn của lĩnh vực AI năm nay.
Trong báo cáo nghiên cứu công nghệ mới nổi của doanh nghiệp Saas do PitchBook công bố năm nay, "AI cảm xúc" đã trở thành một điểm nhấn công nghệ lớn. Nó đề cập đến việc sử dụng công nghệ điện toán cảm xúc và trí tuệ nhân tạo để nhận thức, hiểu và tương tác với cảm xúc của con người, cố gắng phân tích. chúng thông qua Văn bản, nét mặt, âm thanh và các tín hiệu sinh lý khác được sử dụng để hiểu cảm xúc của con người. Nói một cách đơn giản, AI cảm xúc hy vọng máy móc có thể “đọc” được cảm xúc như con người, hoặc thậm chí tốt hơn con người.
Các công nghệ chính của nó bao gồm:
Phân tích biểu hiện khuôn mặt: Phát hiện các biểu hiện vi mô và chuyển động cơ mặt thông qua camera, thị giác máy tính và học sâu.
Phân tích giọng nói: Xác định trạng thái cảm xúc thông qua giọng nói, ngữ điệu và nhịp điệu.
Phân tích văn bản: Giải thích câu và ngữ cảnh với sự trợ giúp của công nghệ xử lý ngôn ngữ tự nhiên (NLP).
Giám sát tín hiệu sinh lý: Sử dụng các thiết bị đeo để phân tích nhịp tim, phản ứng của da, v.v. để cải thiện tính cá nhân hóa tương tác và sự phong phú về cảm xúc.
AI cảm xúc
Tiền thân của AI cảm xúc là công nghệ phân tích cảm xúc. Nó chủ yếu phân tích thông qua tương tác văn bản, chẳng hạn như phân tích và trích xuất cảm xúc của người dùng thông qua văn bản trên mạng xã hội, nó tích hợp nhiều phương thức nhập liệu như hình ảnh và âm thanh. phân tích tình cảm chính xác và đầy đủ hơn.
01 VC ném tiền và các công ty khởi nghiệp nhận được nguồn tài chính khổng lồ
Silicon Rabbit nhận thấy rằng tiềm năng của AI cảm xúc đã thu hút sự chú ý của nhiều nhà đầu tư và một số công ty khởi nghiệp tập trung vào lĩnh vực này, chẳng hạn như Uniphore và MorphCast, đã nhận được khoản đầu tư lớn vào lĩnh vực này.
Uniphore đến từ California đã khám phá các giải pháp đối thoại tự động cho các doanh nghiệp từ năm 2008. Công ty đã phát triển nhiều dòng sản phẩm bao gồm U-Self Serve, U-Assist, U-Capture và U-Analyze để giúp khách hàng sử dụng các công nghệ AI giọng nói, Văn bản, hình ảnh và cảm xúc. để có những tương tác mang tính cá nhân hóa và giàu cảm xúc hơn. U-Self Serve tập trung vào việc xác định chính xác cảm xúc và giọng điệu trong các cuộc trò chuyện, cho phép các công ty cung cấp nhiều dịch vụ được cá nhân hóa hơn để cải thiện sự hài lòng khi tham gia của người dùng;
Tự phục vụ
U-Assist có thể cải thiện hiệu quả công việc của các đại lý dịch vụ khách hàng thông qua hướng dẫn theo thời gian thực và tự động hóa quy trình làm việc; U-Capture có thể cung cấp cho các công ty những hiểu biết sâu sắc về nhu cầu và sự hài lòng của khách hàng thông qua việc thu thập và phân tích dữ liệu cảm xúc tự động; giúp khách hàng xác định các xu hướng chính và những thay đổi cảm xúc trong tương tác, đồng thời cung cấp hỗ trợ quyết định dựa trên dữ liệu để nâng cao lòng trung thành với thương hiệu.
Công nghệ của Uniphore không chỉ cho phép máy móc hiểu ngôn ngữ mà còn hy vọng rằng chúng có thể nắm bắt và diễn giải những cảm xúc ẩn sau giọng điệu và biểu cảm khi tương tác với con người. Khả năng này cho phép các công ty không còn chỉ phản hồi một cách máy móc khi tương tác với khách hàng mà còn đáp ứng tốt hơn nhu cầu cảm xúc của khách hàng. Bằng cách sử dụng Uniphore, các công ty có thể đạt được 87% sự hài lòng của người dùng và cải thiện hiệu suất dịch vụ khách hàng lên 30%.
Uniphore đã hoàn thành hơn 620 triệu USD tài trợ cho đến nay. Vòng đầu tư mới nhất đến từ 400 triệu USD do NEA dẫn đầu vào năm 2022. Các nhà đầu tư hiện tại như March Capital cũng tham gia đầu tư. Sau vòng này, mức định giá đạt 25 tỷ USD. đô la.
Uniphore
Hume AI đã cho ra mắt AI có giọng nói đồng cảm đầu tiên trên thế giới, được thành lập bởi cựu nhà khoa học Google Alan Cowen, người nổi tiếng vì đi tiên phong trong lý thuyết không gian ngữ nghĩa, lý thuyết tiết lộ các sắc thái của giọng nói, khuôn mặt và cử chỉ. Để hiểu được trải nghiệm và biểu hiện cảm xúc, nghiên cứu của Cowen đã được thực hiện. được xuất bản trên nhiều tạp chí, bao gồm cả Tự nhiên và Xu hướng trong Khoa học Nhận thức, đồng thời bao gồm phạm vi mẫu cảm xúc rộng nhất và đa dạng nhất được nghiên cứu cho đến nay.
Được thúc đẩy bởi nghiên cứu này, Hume đã phát triển API lời nói hội thoại - EVI, kết hợp mô hình ngôn ngữ lớn và thuật toán đồng cảm để hiểu và phân tích sâu sắc các trạng thái cảm xúc của con người. Nó không chỉ có thể nhận biết cảm xúc trong lời nói mà còn cung cấp nhiều sắc thái và cá nhân hóa hơn. phản hồi tương tác của người dùng và nhà phát triển có thể sử dụng những khả năng này chỉ với một vài dòng mã và tích hợp chúng vào bất kỳ ứng dụng nào.
AI AI
Một trong những hạn chế chính của hầu hết các hệ thống AI hiện nay là các hướng dẫn của chúng chủ yếu được đưa ra bởi con người. Những hướng dẫn và lời nhắc này dễ mắc lỗi và không thể khai thác được tiềm năng to lớn của trí tuệ nhân tạo (eLLM) do Hume It phát triển. có thể điều chỉnh từ ngữ và ngữ điệu tùy theo ngữ cảnh và biểu hiện cảm xúc của người dùng. Bằng cách lấy hạnh phúc của con người làm nguyên tắc đầu tiên cho việc học, điều chỉnh và tương tác của máy, nó có thể được sử dụng trong nhiều tình huống như sức khỏe tâm thần, giáo dục và đào tạo, các cuộc gọi khẩn cấp. và phân tích thương hiệu Tất cả đều có thể mang lại cho người dùng trải nghiệm tự nhiên và thực tế hơn.
Chỉ trong tháng 3 năm nay, Hume AI đã hoàn thành vòng tài trợ Series B trị giá 50 triệu đô la do EQT Ventures dẫn đầu, với các nhà đầu tư bao gồm Union Square Ventures, Nat Friedman & Daniel Gross, Metaplanet và Northwell Holdings.
Cũng trong lĩnh vực này còn có Entropik, chuyên đo lường phản ứng nhận thức và cảm xúc của người tiêu dùng Thông qua Giải mã, một chức năng kết hợp sức mạnh toàn diện của AI cảm xúc, AI hành vi, AI tổng hợp và AI dự đoán, nó có thể hiểu rõ hơn về hành vi và sở thích của người tiêu dùng. Để cung cấp các đề xuất tiếp thị được cá nhân hóa hơn, Entropik gần đây đã kết thúc vòng tài trợ Series B trị giá 25 triệu đô la vào tháng 2 năm 2023 từ các nhà đầu tư bao gồm SIG Venture Capital và Bessemer Venture Partners.
Sự hỗn loạn
02 Những người khổng lồ tham gia và một cuộc hỗn chiến nổ ra
Dựa vào lợi thế của mình, các hãng công nghệ lớn cũng đã lên kế hoạch trong lĩnh vực AI cảm xúc.
Bao gồm API cảm xúc của Dịch vụ nhận thức Microsoft Azure, có thể xác định niềm vui, sự tức giận, nỗi buồn, sự ngạc nhiên và những cảm xúc khác trong ảnh và video bằng cách phân tích nét mặt và cảm xúc;
API hiểu ngôn ngữ tự nhiên của IBM Watson có thể xử lý lượng lớn dữ liệu văn bản và xác định xu hướng cảm xúc (chẳng hạn như tích cực, tiêu cực hoặc trung tính) đằng sau dữ liệu đó để diễn giải chính xác hơn ý định của người dùng;
API Cloud Vision của Google Cloud AI có khả năng phân tích hình ảnh mạnh mẽ, có thể nhanh chóng xác định các biểu hiện cảm xúc trong ảnh và hỗ trợ nhận dạng văn bản và liên kết cảm xúc;
Rekognition của AWS cũng có thể phát hiện cảm xúc, xác định các đặc điểm trên khuôn mặt và theo dõi những thay đổi về biểu cảm. Nó cũng có thể được sử dụng cùng với các dịch vụ AWS khác để trở thành một ứng dụng phân tích truyền thông xã hội hoàn chỉnh hoặc ứng dụng tiếp thị dựa trên AI về cảm xúc.
API Tầm nhìn đám mây
Một số công ty khởi nghiệp đang phát triển nhanh hơn trong lĩnh vực AI cảm xúc, thậm chí đến mức các ông lớn công nghệ đang “săn trộm” con người. Đơn cử như kỳ lân Inflection AI được nhà đầu tư Microsoft ưu ái cho đội ngũ và mô hình AI của mình đang làm việc. cùng với Bill Gates Sau đó, Eric Schmidt và NVIDIA cùng đầu tư 1,3 tỷ USD vào Inflection AI, họ đã đưa ra lời mời chào cho Mustafa Suleyman, một nhà lãnh đạo AI và là một trong những người đồng sáng lập của Inflection AI. Sau đó, Suleyman và hơn 70 nhân viên đã chuyển sang làm việc khác. cho Microsoft, và Microsoft cũng vậy. Gần 650 triệu USD đã được trả cho việc này.
Tuy nhiên, Inflection AI cũng nhanh chóng tập hợp lại và thành lập một nhóm mới có kiến thức nền tảng về Google Translation, tư vấn AI và AR để tiếp tục phát triển sản phẩm cốt lõi Pi của mình. Pi là trợ lý cá nhân có thể hiểu và phản hồi cảm xúc của người dùng. Không giống như AI truyền thống, Pi chú ý hơn đến việc thiết lập kết nối cảm xúc với người dùng, cảm nhận cảm xúc bằng cách phân tích giọng nói, văn bản và các đầu vào khác cũng như thể hiện sự đồng cảm trong các cuộc trò chuyện. AI uốn cong coi Pi như một huấn luyện viên, người bạn tâm giao, người lắng nghe và đối tác sáng tạo hơn là một trợ lý AI đơn giản. Ngoài ra, Pi còn có chức năng bộ nhớ mạnh mẽ có thể ghi nhớ nhiều lịch sử hội thoại của người dùng để cải thiện tính liên tục của các tương tác và trải nghiệm được cá nhân hóa.
Biến AI Pi
03 Con đường phát triển, những trăn trở và nghi ngờ cùng tồn tại
Mặc dù AI cảm xúc giữ kỳ vọng của chúng ta về một tương tác nhân đạo hơn, giống như tất cả các công nghệ AI, nhưng việc quảng bá nó đi kèm với những lo ngại và nghi ngờ. Đầu tiên, liệu AI cảm xúc có thực sự có khả năng diễn giải chính xác cảm xúc của con người? Về lý thuyết, công nghệ này thực sự có thể làm cho trải nghiệm về dịch vụ, thiết bị và công nghệ trở nên phong phú hơn, nhưng nhìn từ góc độ thực tế, cảm xúc của con người vốn đã mơ hồ và chủ quan. Ngay từ năm 2019, các nhà nghiên cứu đã thảo luận về công nghệ này đã đặt ra câu hỏi, cho rằng nét mặt. không thể phản ánh một cách đáng tin cậy cảm xúc thực của con người. Do đó, có một số hạn chế nhất định khi chỉ dựa vào máy móc để mô phỏng nét mặt, tư thế và ngữ điệu của con người để hiểu cảm xúc.
Thứ hai, sự giám sát chặt chẽ của cơ quan quản lý luôn là trở ngại cho sự phát triển của AI. Ví dụ, Đạo luật AI của EU cấm sử dụng hệ thống phát hiện cảm xúc thị giác máy tính trong các lĩnh vực như giáo dục, điều này có thể hạn chế việc thúc đẩy một số giải pháp AI về cảm xúc; chẳng hạn như Hoa Kỳ Các bang như Illinois cũng có luật cấm thu thập dữ liệu sinh trắc học mà không được phép, điều này trực tiếp hạn chế việc sử dụng một số công nghệ AI cảm xúc nhất định. Đồng thời, quyền riêng tư và bảo vệ dữ liệu là một vấn đề quan trọng. AI cảm xúc thường được sử dụng trong các lĩnh vực như giáo dục, y tế và bảo hiểm có yêu cầu bảo mật dữ liệu đặc biệt nghiêm ngặt. nhu cầu cho mọi vấn đề về cảm xúc mà công ty AI phải đối mặt.
Cuối cùng, giao tiếp và diễn giải cảm xúc giữa những người ở các vùng văn hóa khác nhau là những vấn đề khó khăn và nó thậm chí còn giống một bài kiểm tra đối với AI hơn. Ví dụ, các vùng khác nhau có cách hiểu và thể hiện cảm xúc khác nhau, điều này có thể ảnh hưởng đến hiệu quả của AI cảm xúc. Ngoài ra, AI về mặt cảm xúc cũng có thể gặp khó khăn trong việc giải quyết các thành kiến về chủng tộc, giới tính và bản dạng giới.
AI cảm xúc không chỉ hứa hẹn mang lại hiệu quả cắt giảm nhân lực mà còn có khả năng đọc được lòng người chu đáo mà liệu nó có thể thực sự trở thành giải pháp phổ quát trong tương tác giữa con người với nhau hay sẽ trở thành trợ lý thông minh tương tự Siri trong những công việc đòi hỏi sự thấu hiểu cảm xúc thực sự? Hiệu suất tầm thường? Có lẽ trong tương lai, khả năng "đọc suy nghĩ" của AI sẽ phá hủy sự tương tác giữa con người với máy móc và thậm chí cả con người, nhưng ít nhất hiện tại, việc thực sự hiểu và phản ứng với cảm xúc của con người có thể vẫn cần sự tham gia và thận trọng hơn của con người.