Google、画像からテキストを翻訳できるAI機能を導入

ウェブ上の Google 翻訳を使用して、画像からテキストを変換できるようになりました。モバイル デバイスで利用できる Google レンズの AR 翻訳ツールも同じテクノロジーを使用しています。この開発は言語翻訳の分野における大きな進歩であり、必ずしも知らないさまざまな言語のコンテンツに頻繁にアクセスするユーザーにとって非常に有益となるでしょう。
Google 翻訳のウェブサイトの上部に新しい [画像] タブがあり、そこからコンピューターから写真やスクリーンショットをアップロードできます。写真やスクリーンショットをアップロードすると、元のテキストに似た翻訳が表示されます (ほとんどの場合)。ウェブ インターフェースには、テキストをコピーしたり、翻訳された画像をダウンロードしたり、クリアしたりするオプションがあります。また、自動的に識別できる 113 の利用可能なソース言語と 133 のターゲット言語もリストされています。
結果の下にある「Lens translate」というブランドは、Google LensのAR翻訳に使われているものと同じ生成的敵対的ネットワーク（GAN）がLensにも使われていることを示している。Lensは何年も前からモバイルで写真を翻訳できるが、昨年登場した最新バージョンは、Pixel 6で登場し、現在は古いPixelやGoogle Oneでも利用できるようになったGoogleのMagic Eraserに使われているのと同じ技術を使用している。これにより、翻訳が元のテキストに重なるのではなく、元のテキストを置き換えているように見える。
先月は、Google 関連の AI 製品が多数発表されました。その中には次のようなものがあります。
ChatGPT の背後にある企業 OpenAI は、Google が AI 生成テキストを検出できるように、新しい透かし機能を導入する計画を発表しました。この機能には、単語パターン、文字、句読点を秘密コードの形で埋め込む暗号化が含まれており、生成されたコンテンツで使用される単語パターンを変更して、システムが AI テキスト ジェネレーターの産物であるかどうかを簡単に判断できるようにします。
Pitchfork AI は、独自にコーディング、リファクタリングし、自分自身のコードと他人のコードの両方を使用できる、極秘の Google Labs プロジェクトです。このプロジェクトは Alphabet の X 部門によって開始され、夏に Google Labs に引き継がれました。Pitchfork ではプログラミング言語を学習し、新しいコードを開発する必要がありますが、Google はすでにその原理を理解しています。プログラマーを介さずに、Google 内の Python コードベースを新しいバージョンに使用する汎用プランが開発されました。
Google は、企業やクリエイターがアバターを使って仮想の自分を表現できるようにする Alter を買収しました。この事業の買収に Google は約 1 億ドルを支払いました。これは、Google による最近の AI 買収の一連の中で最新のものです。Google は Alter の技術を使用してコンテンツの提供を強化および拡張する予定であり、Alter が制御するアバターを使用してユーザーとビデオ通話を行う AI 関連の実験プロジェクトですでに Google と連携しています。Alter のテキストからアバターに変換する技術は、ユーザーに新しい、クリエイティブで独特なアバターを提供して、優れた体験を生み出すことができます。
関連記事をもっと読む:
Google ではなく AI 搭載の Bing を使うべき 5 つの理由
SingSong: Google AI 研究者が入力ボーカルに合わせて音楽を生成する方法を発見
元GoogleとYouTubeの幹部がAI搭載検索エンジンNeeva AIを国際的に立ち上げ
Google が画像からテキストを翻訳できる AI 機能を導入するという記事が最初に Metaverse Post に掲載されました。