グーグルは「Chromeブラウザ」にAIを活用してブラウジング体験を向上させる新機能を追加すると発表しました。
Chromeのエンジニアリングディレクターであるアドリアナ・ポーター・フェルト氏によると、タブの使用、検索、フォーム入力、ウェブページの閲覧など、日常的なアクションを容易にするために、ラージ言語モデル(LLM)の可能性を探求してきたとのことです。
新たに導入される3つのAI機能は、「AIテーマ」「タブオーガナイザー」「ヘルプミーライト」と名付けられています。AIテーマはテキストから画像を生成するモデルを使用し、Chromeブラウザのビジュアルをカスタマイズします。「似たタブを整理する」機能、すなわちタブオーガナイザーは、開いているウェブページをカテゴリーごとに賢くグループ化し、探しやすくします。そして「ヘルプミーライト」は、インターネット上での特定のニーズに合わせた文章を作成します。
Chromeが2008年に登場した当初は、ユーザーにコンテンツを迅速に提供し、ブラウザ自体はできるだけ目立たないようにすることが目標でした。しかし、ポーター・フェルト氏によると、時間とともに人々のブラウジング習慣は変化し、今日では多くの人々がアシスタントのような存在を求めているとのことです。
AIがブラウジング体験を向上させる
例えば、休暇の計画を立てたり、長いフォームを記入する際に、プロセスを加速させる手助けが欲しいというニーズがあります。新機能は、ユーザーの邪魔をせずに物事を容易にすることを目指しています。
エンジニアリングの観点からは、LLM技術をChromeに組み込むことは挑戦だったということです。従来のブラウザ機能は、同じ入力に対して常に同じ出力を提供しますが、AIを利用した機能はそうはいきません。
大規模言語モデルはテキストや画像を認識し生成するため、多様なユーザー入力に適応する必要があります。ポーター・フェルト氏とそのチームは、基本モデルに対して、特定の使用例に合わせて学習させ、多様なユーザーシナリオに対して評価を行いました。その結果、単純な動作テストを超えた、より深い人間による評価が必要となりました。
特に興味深いトレーニングシナリオとして、AIタブオーガナイザーが絵文字を使用する方法が挙げられます。ポーター・フェルト氏は、タブグループに絵文字をラベルとして使用する人々の様子を見て、そのトピックをタブをスキャンする際に簡単に識別できるようにするアイデアを気に入りました。
しかし、不適切な絵文字を選択する可能性を避けるため、Googleの絵文字チームの協力を得て、広範囲で安全に使用できるタブグループカテゴリーをマッピングしました。
新しいAI機能を、その基礎となる技術を理解していない人々でも使用できるようにすることも、チームにとって重要なポイントでした。たとえば、「ヘルプミーライト」は、あなたが閲覧しているウェブページから文脈を収集し、そこから文章作成を開始します。
レストランのレビューを書きたい場合には、それに合わせて調整し、フォームの記入や何かを販売する際の支援を行います。
同様に、AIテーマツールを作成する際には、当初ユーザーが自分でプロンプトを書いてビジュアルテーマを生成することを考えていましたが、実際にはプロンプトを考えるのが難しいと気づきました。そのため、オーロラや虹などの主題を選択し、スタイリングの詳細を追加し、色のスキームを選択するドロップダウン方式を採用したということです。