Giganci walczą o układ, a inwestorzy VC wyrzucają pieniądze, aby umożliwić „AI czytanie w myślach”, firmy te wariują.

Napisał: Lexie
Redaktor: Lu
W wielkiej dyskusji na temat sztucznej inteligencji ludzie przypisują jej rolę albo naszego najpotężniejszego i najskuteczniejszego asystenta, albo „armii maszyn”, która nas obali. Niezależnie od tego, czy jest to wróg, czy przyjaciel, sztuczna inteligencja musi nie tylko być w stanie aby wykonywać zadania przydzielone przez ludzi, musisz także umieć „czytać” ludzkie serca, a ta umiejętność czytania w myślach jest również w tym roku najważniejszym wydarzeniem w dziedzinie sztucznej inteligencji.
W opublikowanym w tym roku przez PitchBook raporcie z badań nad nowymi technologiami przedsiębiorstwa Saas „emocjonalna sztuczna inteligencja” stała się głównym osiągnięciem technologicznym. Odnosi się ona do wykorzystania technologii przetwarzania emocji i sztucznej inteligencji do postrzegania, rozumienia i interakcji z ludzkimi emocjami, próbując je analizować je poprzez tekst, mimikę, dźwięki i inne sygnały fizjologiczne, aby zrozumieć ludzkie emocje. Mówiąc najprościej, emocjonalna sztuczna inteligencja ma nadzieję, że maszyny będą w stanie „czytać” emocje jak ludzie, a nawet lepiej niż ludzie.
Do jego głównych technologii należą:
Analiza wyrazu twarzy: wykrywaj mikroekspresję i ruchy mięśni twarzy za pomocą kamer, obrazu komputerowego i głębokiego uczenia się.
Analiza głosu: Identyfikuj stany emocjonalne na podstawie głosu, intonacji i rytmu.
Analiza tekstu: Interpretuj zdania i kontekst za pomocą technologii przetwarzania języka naturalnego (NLP).
Monitorowanie sygnałów fizjologicznych: używaj urządzeń do noszenia do analizy tętna, reakcji skórnych itp., aby poprawić personalizację interakcji i bogactwo emocjonalne.
Emocje AI
Poprzedniczką emocjonalnej sztucznej inteligencji jest technologia analizy emocji. Analizuje ona głównie poprzez interakcję tekstową, na przykład analizowanie i wydobywanie emocji użytkowników za pomocą tekstu w mediach społecznościowych. Dzięki błogosławieństwu sztucznej inteligencji integruje wiele metod wprowadzania danych, takich jak obietnice wizualne i dźwiękowe dokładniejszą i kompletniejszą analizę nastrojów.
01 VC rzuca pieniądze, a startupy otrzymują ogromne finansowanie
Silicon Rabbit zauważa, że ​​potencjał emocjonalnej sztucznej inteligencji przyciągnął uwagę wielu inwestorów. Niektóre startupy skupiające się na tej dziedzinie, takie jak Uniphore i MorphCast, pozyskały już duże inwestycje w tym kierunku.
Firma Uniphore z Kalifornii bada rozwiązania zautomatyzowanego dialogu dla przedsiębiorstw od 2008 roku. Opracowała wiele linii produktów, w tym U-Self Serve, U-Assist, U-Capture i U-Analyze, aby pomóc klientom korzystać z technologii AI głosowych, tekstowych, wizualnych i emocjonalnych dla bardziej spersonalizowanych i bogatych emocjonalnie interakcji. U-Self Serve koncentruje się na dokładnym identyfikowaniu emocji i tonu rozmów, umożliwiając firmom świadczenie bardziej spersonalizowanych usług w celu poprawy zadowolenia użytkowników z uczestnictwa;
U-Samoobsługa
U-Assist może poprawić efektywność pracy agentów obsługi klienta poprzez wskazówki w czasie rzeczywistym i automatyzację przepływu pracy; U-Capture może zapewnić firmom dogłębny wgląd w potrzeby i zadowolenie klientów poprzez automatyczne gromadzenie i analizę danych emocjonalnych, a U-Analyze może pomagają klientom identyfikować kluczowe trendy i zmiany emocjonalne w interakcjach oraz zapewniają wsparcie w podejmowaniu decyzji w oparciu o dane, aby zwiększyć lojalność wobec marki.
Technologia Uniphore nie tylko pozwala maszynom rozumieć język, ale ma także nadzieję, że uda im się uchwycić i zinterpretować emocje ukryte za tonem i ekspresją podczas interakcji z ludźmi. Ta zdolność pozwala firmom nie tylko na mechaniczne reagowanie podczas interakcji z klientami, ale także na lepsze zaspokajanie potrzeb emocjonalnych klientów. Dzięki zastosowaniu Uniphore firmy mogą osiągnąć poziom zadowolenia użytkowników na poziomie 87% i poprawić wydajność obsługi klienta o 30%.
Uniphore zrealizowało dotychczas finansowanie o wartości ponad 620 mln USD. Ostatnia runda inwestycji wyniosła 400 mln USD pod przewodnictwem NEA w 2022 r. W inwestycji uczestniczyli także obecni inwestorzy, tacy jak March Capital. Po tej rundzie wycena osiągnęła 25 miliardów dolarów.
Unifor
Hume AI uruchomił pierwszą na świecie empatyczną sztuczną inteligencję głosową, założoną przez byłego naukowca Google Alana Cowena, który słynie z pioniera teorii przestrzeni semantycznej, która ujawnia niuanse głosów, twarzy i gestów, aby zrozumieć doświadczenia i ekspresję emocjonalną opublikowane w wielu czasopismach, w tym w Nature i Trends in Cognitive Science, i obejmują najszerszy i najbardziej zróżnicowany zakres badanych dotychczas próbek emocji.
Kierując się tymi badaniami, Hume opracował interfejs API mowy konwersacyjnej – EVI, który łączy w sobie duży model języka i algorytm empatii, aby dogłębnie rozumieć i analizować ludzkie stany emocjonalne. Potrafi nie tylko rozpoznawać emocje w mowie, ale także zapewnia bardziej zniuansowany i spersonalizowany odpowiedzi na interakcje użytkownika, a programiści mogą wykorzystać te możliwości za pomocą zaledwie kilku linijek kodu i wbudować je w dowolną aplikację.
Hume AI
Jednym z głównych ograniczeń większości obecnych systemów sztucznej inteligencji jest to, że instrukcje są wydawane głównie przez ludzi. Te instrukcje i podpowiedzi są podatne na błędy i nie pozwalają na wykorzystanie ogromnego potencjału sztucznej inteligencji (eLLM) opracowanego przez Hume It potrafi dostosować słowa i intonację do kontekstu i ekspresji emocjonalnej użytkownika. Przyjmując ludzkie szczęście za pierwszą zasadę uczenia maszynowego, dostosowywania i interakcji, można je wykorzystać w wielu scenariuszach, takich jak zdrowie psychiczne, edukacja i szkolenia, połączenia alarmowe. i analiza marki Wszystkie mogą zapewnić użytkownikom bardziej naturalne i prawdziwe doświadczenia.
Tylko w marcu tego roku Hume AI zakończyła rundę finansowania serii B o wartości 50 milionów dolarów pod przewodnictwem EQT Ventures, z inwestorami takimi jak Union Square Ventures, Nat Friedman & Daniel Gross, Metaplanet i Northwell Holdings.
Również w tej dziedzinie działa Entropik, który specjalizuje się w pomiarze reakcji poznawczych i emocjonalnych konsumentów. Dzięki Decode, funkcji łączącej wszechstronną moc emocjonalnej sztucznej inteligencji, behawioralnej sztucznej inteligencji, generatywnej sztucznej inteligencji i predykcyjnej sztucznej inteligencji, może lepiej zrozumieć zachowania i preferencje konsumentów Aby zapewnić bardziej spersonalizowane rekomendacje marketingowe, Entropik niedawno zamknął w lutym 2023 r. rundę finansowania serii B o wartości 25 milionów dolarów od inwestorów, w tym SIG Venture Capital i Bessemer Venture Partners.
Entropik
02 Giganci wzięli udział i wybuchła walka wręcz
Opierając się na własnych przewagach, największe firmy technologiczne poczyniły plany również w obszarze emocjonalnej sztucznej inteligencji.
Zawiera interfejs API emocji usługi Microsoft Azure Cognitive Services, który może identyfikować radość, złość, smutek, zaskoczenie i inne emocje na zdjęciach i filmach poprzez analizę wyrazu twarzy i emocji;
Interfejs API rozumienia języka naturalnego IBM Watson może przetwarzać duże ilości danych tekstowych i identyfikować stojące za nimi tendencje emocjonalne (takie jak pozytywne, negatywne lub neutralne), aby dokładniej interpretować intencje użytkownika.
Interfejs Cloud Vision API Google Cloud AI ma zaawansowane możliwości analizy obrazu, może szybko identyfikować wyrazy emocjonalne na obrazach oraz obsługuje rozpoznawanie tekstu i kojarzenie emocji;
Rozpoznawanie AWS może również wykrywać emocje, identyfikować rysy twarzy i śledzić zmiany w wyrazie. Można go również używać w połączeniu z innymi usługami AWS, aby stać się kompletną analizą mediów społecznościowych lub aplikacją marketingową opartą na emocjach.
Interfejs API Cloud Vision
Niektóre start-upy rozwijają się szybciej w dziedzinie emocjonalnej sztucznej inteligencji, nawet do tego stopnia, że ​​giganci technologiczni „kłusują” na ludzi. Na przykład inwestor Microsoft preferuje jednorożca Inflection AI ze względu na swój zespół i model sztucznej inteligencji Microsoft współpracując z Billem Gatesem. Eric Schmidt i NVIDIA wspólnie zainwestowały 1,3 miliarda dolarów w Inflection AI i zaoferowały gałązkę oliwną Mustafie Suleymanowi, liderowi AI i jednemu ze współzałożycieli Inflection AI. Następnie Suleymanowi i ponad 70 pracownikom przeszedł na Microsoft i Microsoft również zapłacono za to prawie 650 milionów dolarów.
Jednak firma Inflection AI również szybko się przegrupowała i utworzyła nowy zespół z doświadczeniem w tłumaczeniach Google, konsultingu AI i AR, aby kontynuować pracę nad swoim podstawowym produktem Pi. Pi to osobisty asystent, który rozumie emocje użytkowników i reaguje na nie, w przeciwieństwie do tradycyjnej sztucznej inteligencji, Pi przywiązuje większą wagę do nawiązywania więzi emocjonalnych z użytkownikami, wyczuwania emocji poprzez analizę głosu, tekstu i innych informacji wejściowych oraz okazywanie empatii w rozmowach. Inflection AI traktuje Pi jako trenera, powiernika, słuchacza i partnera kreatywnego, a nie zwykłego asystenta AI. Ponadto Pi ma potężną funkcję pamięci, która może zapamiętać historię wielu rozmów użytkownika, aby poprawić ciągłość interakcji i spersonalizowane doświadczenia.
Przegięcie AI Pi
03 Droga do rozwoju, obawy i wątpliwości współistnieją
Chociaż emocjonalna sztuczna inteligencja podtrzymuje nasze oczekiwania co do bardziej humanitarnej interakcji, podobnie jak wszystkie technologie sztucznej inteligencji, jej promocji towarzyszą obawy i wątpliwości. Po pierwsze, czy emocjonalna sztuczna inteligencja naprawdę dokładnie interpretuje ludzkie emocje? Teoretycznie technologia ta rzeczywiście może wzbogacić doświadczenia związane z usługami, urządzeniami i technologią, ale z praktycznego punktu widzenia ludzkie emocje są z natury niejasne i subiektywne. Już w 2019 roku badacze dyskutowali na ten temat. Technologia ta wzbudziła wątpliwości, twierdząc, że mimika twarzy nie może w sposób wiarygodny odzwierciedlać prawdziwych ludzkich emocji, dlatego też istnieją pewne ograniczenia w poleganiu wyłącznie na maszynach do symulowania ludzkiej mimiki, postawy i intonacji w celu zrozumienia emocji.
Po drugie, ścisły nadzór regulacyjny zawsze był przeszkodą w rozwoju sztucznej inteligencji. Na przykład unijna ustawa o sztucznej inteligencji zabrania stosowania komputerowych systemów wykrywania emocji w takich dziedzinach jak edukacja, co może ograniczać promowanie niektórych rozwiązań w zakresie sztucznej inteligencji związanej z emocjami; takie jak Stany Zjednoczone, takie jak Illinois, również obowiązują przepisy zabraniające gromadzenia danych biometrycznych bez pozwolenia, co bezpośrednio ogranicza wykorzystanie niektórych technologii sztucznej inteligencji związanych z emocjami. Jednocześnie prywatność i ochrona danych jest ważną kwestią. Sztuczna inteligencja emocjonalna jest zwykle wykorzystywana w takich dziedzinach, jak edukacja, zdrowie i ubezpieczenia, które mają szczególnie rygorystyczne wymagania dotyczące prywatności danych. Dlatego zapewnienie bezpieczeństwa i legalnego wykorzystania danych emocjonalnych jest koniecznością wymaganie dla każdej emocjonalnej firmy zajmującej się sztuczną inteligencją.
Wreszcie komunikacja i interpretacja emocjonalna między ludźmi z różnych regionów kulturowych stanowią trudne problemy, a tym bardziej stanowią test dla sztucznej inteligencji. Na przykład różne regiony mają różne sposoby rozumienia i wyrażania emocji, co może mieć wpływ na skuteczność emocjonalnej sztucznej inteligencji Seksualność i integralność Ponadto emocjonalna sztuczna inteligencja może również napotkać znaczne trudności w radzeniu sobie z uprzedzeniami rasowymi, związanymi z płcią i tożsamością płciową.
Emocjonalna sztuczna inteligencja nie tylko obiecuje skuteczność w ograniczaniu siły roboczej, ale także troskliwość czytania ludzkich serc, ale czy naprawdę może stać się uniwersalnym rozwiązaniem w interakcjach międzyludzkich, a może stanie się inteligentnym asystentem podobnym do Siri w zadaniach wymagających prawdziwego zrozumienia emocjonalnego? Przeciętna wydajność? Być może w przyszłości „czytanie w myślach” sztucznej inteligencji zakłóci interakcję człowiek-maszyna, a nawet człowiek, ale przynajmniej na razie prawdziwe zrozumienie ludzkich emocji i reagowanie na nie może w dalszym ciągu wymagać większego zaangażowania i ostrożności ze strony człowieka.
Źródła referencyjne:
Uniphore ogłasza serię E o wartości 400 milionów dolarów (Uniphore)
Hume AI ogłasza zbiórkę 50 milionów dolarów i empatyczny interfejs głosowy (Yahoo Finance)
Przedstawiamy Pi, Twoją osobistą sztuczną inteligencję (Inflection AI)
„Sztuczna inteligencja emocjonalna” może być kolejnym trendem w oprogramowaniu biznesowym, a to może być problematyczne (TechCrunch)
BADANIA NAD NOWOCZESNYMI TECHNOLOGIAMI Raport Enterprise Saas (PitchBook)