OpenAI
OpenAI社はChatGPTのパーソナライズ機能を強化するアップデートを発表しました。ユーザーとの過去すべての対話履歴を参照して回答に反映できるようにし、対話を通じてユーザーの好みや情報を学習することで、より個別化された応答が可能になります。Sam Altman CEOは「これはAIが生涯にわたってユーザーを理解し、極めて有用でパーソナライズされた存在になることへの第一歩」だと説明しています。ユーザーはこの新機能を任意で無効化することもでき、保存されない一時チャットモードも提供されます。
Google社は今週開催の自社イベント「Cloud Next ’25」にて、生成AIに関する数多くの新発表を行いました。内容はAIエージェント開発のためのフレームワークから、業務アプリへのAI統合、新たな大規模言語モデルのプレビュー公開、業界標準への対応まで多岐にわたります。主な発表は以下の通りです:
- AIエージェント開発基盤の強化: オープンソースの「Agent Development Kit (ADK)」を公開し、AIエージェントの構築からデプロイまでを支援するフレームワークを提供しました。また、AIエージェント同士が安全に情報交換し協調動作できる通信規格「Agent2Agent (A2A)」も発表しています。さらにエンタープライズ向けプラットフォーム「Agentspace」において、Chromeの検索ボックスから社内データを統合検索・分析できる機能や、ノーコードでエージェントを作成できるツールを導入し、Google製エージェント「Deep Research」と「Idea Generation」の提供も開始しました。
- Google Workspaceへの生成AI統合: 文書作成や表計算などのクラウドオフィス製品にもAI機能を拡充しました。たとえばGoogleドキュメントでは文章から音声ナレーション付きの音声ファイルを自動生成する機能や、文章の書き直しを提案する「Help me refine」ツールを追加しました。さらに、Chat(チャット)ではチーム向けに生成AIを活用する新機能を投入し、スプレッドシート(Sheets)ではデータを自動分析して重要な洞察を提示できるAI機能が利用可能になります。加えて、繰り返し業務を自動化するワークフロー作成機能「Workspace Flows」も導入されました。
- クラウドAIサービスの強化: 開発者向けのGoogle Cloudプラットフォームでも新たな生成AIツールを発表しました。マルチモーダルAIモデル群「Gemini」を活用し、動画・画像・音声・音楽を生成できる新機能をVertex AIプラットフォームに追加する計画を明らかにしています。加えて、Googleの最新LLMである「Gemini 2.5 Pro」モデルを一般向けプレビューとして公開しました。Gemini 2.5 Proは大幅に拡張された長いコンテキスト(20万トークン超)を扱えるモデルで、Googleはこのプレビュー版の利用料金モデルも公表しています。
- 業界標準への支持: Googleはまた、Anthropic社が提唱するAIエージェント用のオープン標準プロトコル「MCP (Model Context Protocol)」を自社のGeminiモデルでサポートすると表明しました。MCPはAIが外部のデータソースやサービスと連携するための規格で、OpenAI社も既に採用の意向を示している標準です。Demis Hassabis氏(Google DeepMind CEO)は「MCPはエージェント時代における優れたプロトコルで、急速にオープン標準になりつつある」と述べ、業界の他企業と協力して同プロトコルを発展させていく考えを示しました。
Microsoft
Microsoft社は自社のAIアシスタント機能「Copilot」に関する大規模アップデートを実施しました。開発者向けのGitHub Copilotからエンドユーザー向けのCopilot機能まで、AIがより主体的かつユーザー個人に寄り添う動作を目指した変更が行われています。主なポイントは以下の通りです:
- GitHub Copilotのエージェントモード: プログラミング支援AIであるGitHub Copilotの新バージョンをリリースし、Visual Studio Code上でエージェントモードが利用可能になりました。このモードではCopilotがプロジェクト全体を横断して解析・編集を行い、ターミナルコマンドの提案やエラー原因の分析まで自動で実施します。シンプルな指示を与えるだけで、関連ファイルの修正や必要なテストコードの生成など目標達成に必要な一連のサブタスクを自動で完了することが可能であるとされています。実際、GitHubはデモ動画で、開発者の指示に応じてウェブサイトのバックエンドとUIを修正し、単体テストまで生成して実行準備まで行う様子を紹介しました。
- 「あなた専用」のCopilotへ: MicrosoftはCopilotを単なる汎用AIからユーザー個人に最適化されたAIコンパニオンへと進化させるアップデートも発表しました。Copilotがユーザーとの対話内容を長期的に記憶し、好みや習慣を学習できるようになり、ユーザーのペットの名前や担当プロジェクトなどの詳細も覚えて反映します。さらに新機能として、複数ステップの調査を自動で行う「Deep Research」、ユーザーに代わって予約手配などのタスクを実行する「Actions」、ノートやコンテンツを一つのキャンバスにまとめる「Pages」、カメラ等を通じてユーザーの見ているものを理解しリアルタイム応答する「Vision」といった強力な機能拡張が加わりました。アップデート後のCopilotはユーザーの文脈に沿って適切な形で支援を提供する「よりパーソナルなAI秘書」となり、「技術との新しい関係」を築くものだとMicrosoftは述べています。
Meta
Meta社は次世代の大規模言語モデル群となる「Llama 4」ファミリーの一部を発表しました。今回は3つのモデルが公開されており、特に「Llama 4 Scout」と「Llama 4 Maverick」の2モデルが一般提供されています。これらはいずれもテキスト・画像・音声・動画のマルチモーダルデータを統合的に処理できるモデルで、大量の未ラベルデータで訓練されており「視覚的な理解力」に優れるとされています。Meta社は「これらは当社史上最も高度なモデルであり、マルチモーダル性能においてクラス最高」であると述べており、オープンソースソフトウェアとして提供することも明らかにしました。加えて、約2兆パラメータ規模にも及ぶ教師モデル「Llama 4 Behemoth」をプレビュー版として披露しており、今後のモデル群の精度向上に活用するとしています。
Anthropic
Anthropic社(ChatGPTの競合AI「Claude」の開発企業)は、欧州市場での事業拡大に向けた動きを発表しました。ヨーロッパに100名以上の新規採用ポジションを設け、ダブリンとロンドンを中心に研究開発や営業チームを拡充する計画です。また、欧州・中東・アフリカ地域(EMEA)の責任者にGuillaume Princen氏(元Stripe欧州統括責任者)を任命したことも明らかにしました。Anthropic社はAmazonやGoogleから出資を受けて急成長しており、Claudeはすでに広告大手WPPや自動車BMW、製薬ノボ・ノルディスクなどによって活用されています。
Amazon (AWS)
Amazon傘下のAWSもこの週、生成AI分野で新たなサービス展開を行いました:
- 音声対話モデル「Nova Sonic」の発表: Amazonは自社の生成AIモデルファミリー「Nova」に、新たに音声から音声への対話モデル「Nova Sonic」を追加すると発表しました。通常、音声認識と音声生成は別々のAIモデルで行われますが、Nova Sonicではそれらを単一モデルで統合しています。その結果、入力音声の話速や声色(抑揚)に応じて応答音声の調子を動的に調整できる柔軟な対話が可能になると説明されています。このモデルは人間らしい双方向の音声対話に向けた技術的ブレークスルーとして注目されました。
- MetaのLlama 4モデルをAWSで提供開始: AWSはMeta社が公開した最新LLM「Llama 4」ファミリーの一部モデルを自社クラウド上でいち早く利用可能にしたと発表しました。公開された17Bパラメータ規模のLlama 4 ScoutおよびMaverickモデルが、開発者向けサービスであるAmazon SageMaker JumpStartからすでに利用できます(近日中にサーバーレスのAmazon Bedrockにも対応予定)。これらLlama 4モデルは画像とテキストを同時に理解できる高度なマルチモーダル能力と、業界トップクラスの長い文脈ウィンドウを備えており、前世代に比べ高効率で強力なAI処理を実現するとされています。AWSはこの提供により、クラウド上で幅広い最新の生成AIモデルを即座に活用できる環境を拡充した形です。
コメント