AI関連のニュースには目を離せません。最新のニュースをお届けします。
チャットGPT関連 NEWS (~2023/7/14) (7/15~7/31) (8/1~8/15) (8/16~8/31)
(9/1~9/14) (9/15~11/15) (11/16~12/31) (2024/1/1~1/31) (2024/2/1~)
「生成AIはプログラムを書くのが得意」とは以前から言われていたが、それでも未経験者にはハードルが高かった。生成AIにプログラムを書かせても、そのプログラムを実行する環境がなければ試すことができず、デバッグやブラッシュアップができないためだ。しかし6月下旬にAnthropic(アンスロピック)がClaudeの新機能として発表した「Artifacts」では、生成したプログラムを専用ウインドウでそのまま実行し、プロンプトを追加することで修正や調整、機能追加などをリアルタイムに行えるようになった。
「SearchGPT」は、OpenAIが提供するAIモデルの強みを、Webからの情報と組み合わせることで、明確かつ関連性の高いソースによる検索結果を、迅速かつタイムリーに提供するように設計された新しい検索サービスのプロトタイプで、少数のユーザーとパブリッシャー向けに公開しているという。
ChatGPTの高度な音声モードは、AIが人間の声に込められた感情(トーン)や非言語的な合図を理解し、リアルタイムでより自然な会話を実現する機能。同社が5月に開催したイベントで発表され、当初は6月下旬にアルファ版を公開する予定だったが、さらなる改善が必要になったとして公開を1ヵ月延期していた。
SearchGPTは、ChatGPTのような自然言語の対話で情報を検索できる機能。ユーザーからの質問に対し、AIがWeb上の最新情報を利用してすばやく直接回答するとともに、回答に関連する情報源へのリンクも提供する。質問ごとにコンテクストが構築されるため、人間と対話するときのように続けて質問していくことも可能。これまでのWeb検索では、ユーザーの求める回答を得るために手間がかかることがあったが、SearchGPTではより迅速かつ簡単に回答を見つけ出せるとしている。
Copilot Studioは、文章の作成や要約、データ分析など日常業務で利用できる生成AIアシスタント「Microsoft Copilot」をカスタマイズできるサービス。Power Platformとの連携により、社員や顧客をサポートするチャットボットの構築やワークフローの起案、社内外のシステムとのデータ連携が可能になるという。
日本加除出版株式会社は7月25日、結婚生活に悩みを抱える人を「AIカウンセラー」と「AI司書」がサポートする情報提供サービス「離コンパス」を発表した。「AIカウンセラー」はユーザーの悩みに耳を傾け、心の整理を手伝う。「AI司書」はユーザーの悩みに合わせて日本加除出版の専門書籍を推薦し、要約とポイントを案内する。
OpenAIがGPT-4からGPT-5へのメジャーアップデートに苦戦している中、ライバル勢が急速に台頭してきている。グーグルは「Gemini 1.5 Pro」、Anthropicは「Claude 3.5 Sonnet」、メタは「LlaMA 3.1 405B」と、GPT-4に匹敵する性能を持つモデルを次々と発表している。
検索結果ページの中央トップに、LLMおよびSLM(小規模言語モデル)が生成したという回答が表示される。この回答の下には、回答のソースとした主なWebサイトへのリンクが表示され、その下には関連する動画やWebサイトが並ぶ。従来のBing検索結果は右の別カラムに表示されている。
同社ではコロナ禍の影響により、あいさつ実施の減少傾向がみられたことから、「笑顔やあいさつのトレーニングを一から実施する必要がある」と判断。「従業員が主体的に体験・体感し楽しくトレーニングができるツール」として、スマイルくんの開発に着手した。2023年に一部店舗で実験的に導入し、「笑顔・発声の基準」として、口角の角度や声の大きさ、言葉の抑揚、滑舌などの基準を設定。その上で、出勤したタイミングで1日30秒、スマイルくんによるトレーニングを実施した。
OpenAIの「GPT-4」など、「広く浅く何でもできる」土台を構築する汎用型LLMに対し、限られた領域で「狭く深くカスタマイズできる」ことを重視する個別型LLMとして、NECが独自開発した「cotomi」の実力を見てきたい。
同大は2026年4月に、AIを使ったデータ分析や社会課題の解決ができる人材の育成を目指す「AIライフデザイン学部(仮称)」を開設予定だ。AIが普及すると、実行してほしい命令をAIに適切に伝える「会話力」が重要になると考えられており、新学部は理系・文系の概念を超えた全方位型の学部を目指すという。
目玉の発表の1つが「AWS App Studio」で、現在パブリックプレビューで提供されている。これは、生成AIを用いて自然言語とプロンプトでアプリケーションを構築することができる。アプリの機能やデータソースを指定すると、App Studioは「プロの開発者がゼロから構築するのに数日かかるような」アプリを数分で作成するという。
世界初となる「ミスAIコンテスト」が開催され、モロッコのインフルエンサー、ケンザ・レイリが優勝した。100%AIによって生成されたバーチャルキャラクター、レイリは、フランスのラリナ・ヴァリナやポルトガルのオリヴィア・Cを抑え賞金5000ドル(約81万円)のほか、世界最大のAIクリエイターのプラットフォームでのサポート、および専属の広報を獲得することになった。
Typolessは、朝日新聞の過去40年間の記事データと膨大な校正履歴を学習させたAIに約10万個の校閲ルール辞書の機能、ユーザーが独自に登録する「カスタム辞書」機能を加えた校正ツール。Wordでの文章作成中にリアルタイムでのAI校正が可能になり、より効率的な文書作成が実現する。Wordアドイン機能は「プレミアムプラン」と法人向けの「エンタープライズプラン」で現在の料金のまま使える。
オリジナルの物語から映像/音声/音楽など全編を生成AIで製作する映画「generAIdoscope:ジェネレイドスコープ」の製作が決定。画像生成AI「Stable Diffusion」やOpenAIが発表した動画生成モデル「Sora」など、登場からすさまじい勢いで進化を続ける生成AI。映画や映像芸術の世界でも生成AIを用いたクリエイティブが増える中、部分的な利用ではなく、映像/音声/音楽など全編にわたって生成AIで作り上げようとする意欲的な試みです。
まるで生きているかのようにスピーチできたのは、生前に自ら開発に携わった生成AIシステム「商湯如影」のなせるわざ。長さ数十秒の動画さえあれば声や姿、表情も極めてリアルに再現できる。湯氏と一緒に仕事をしていた男性社員は「全く区別がつかず、本人が話しているようだった」と述懐した。
これまでCopilot in Windowsのアイコンはタスクバーの右端に固定されていたが、今後は通常のアプリと同様にタスクバーにピン留めされるようになる。あわせて、ウィンドウサイズの変更や移動、スナップも可能となり、操作感も通常のアプリと同じになる。
LINEヤフーは「LINE広告」と「Yahoo!広告 ディスプレイ広告」の広告管理ツールで、生成AI(人工知能)によるタイトルや説明文を提案する機能の提供を始めたと7月9日に発表した。広告主が広告に設定するリンク先URLなどを入力すると、その情報をもとに生成AIがタイトルや説明文を提案する。広告主は、提案されたタイトルや説明文の確認と調整だけで簡単に広告を作成することができ、提案機能を無料で利用できる。
生成AIプロンプトアシスタントは、Webブラウザー上で動作するアプリケーションで、業務においてCopilot for Microsoft 365やChatGPTなどの生成AIを活用する際、その回答の精度を最大限に高められるよう最適化された、約150種類のプロンプトテンプレートを提供する。
アイデアを出したり、書類のたたき台を作成したりする工程は、ChatGPTの得意とする作業だ。まず、企画の元になるネタが思い浮かばない場合には、ChatGPTに直接聞いてみるのが良いだろう。例えば、「2024年後半に売れそうなムックの企画を3つ考えて」と質問すると、ChatGPTが具体例を考えてくれる。
Perplexityは、質問に対してテキストで答えてくれる、チャットbot型生成AIだ。ChatGPTと似ているが、検索に特化しており、「Webの最新情報をベースに検索できる」点が異なる。Perplexityは、質問を自ら深めて新たな質問を提案してくれるのもスゴい。
Copilot for Microsoft 365は、生成AIを活用したソリューションの1つです。生成AIの活用と聞けば、AIへの指示である「プロンプト」を上手に作成し使いこなす姿を思い浮かべる人も多いでしょう。プロンプトの作成スキルはプロンプトエンジニアリングとも呼ばれ、生成AIを深く活用するために習得すべきとされています。Copilot for Microsoft 365は、この面倒なプロンプトを書かずとも、簡単に生成AIを利用できる機能が実装されていることが特徴です。
例えば、「打ち合わせを打診するメールに対して、「その時期は忙しくて行けない」と伝えるメールを書いて」と指示すると、「残念ながら、その時期は私のスケジュールが非常に混み合っており、参加することが難しい状況です。大変申し訳ございませんが、他の日程での調整は可能でしょうか。」といった内容のメール本文をChatGPTが出力してくれる。
「地名 観光」と検索すると、該当エリアの概要などの観光情報にくわえて、生成AIがテーマに沿って観光モデルコースを提案。モデルコースは、該当エリアの象徴的なスポットが揃う「王道」のほか、「ファミリー」「女子旅」「友達」「デート」の最大5パターン。コースの地図と拠点間の移動手段、移動時間が確認できる。
スマイルくんに向かってあいさつすると、450以上の顔の特徴点を判別して100段階でスコアリングし、声量、滑舌、調子(音程)もリアルタイムに分析。笑顔・発声の完成度を評価する。
AI関連の職種には2つのレベルがあることが明らかになりつつある、とペンシルベニア大学工学応用科学大学院の学部教育担当副学部長のRobert Ghrist氏は語る。「1つは、AIスペシャリストと呼ばれるような職種だ。このような人材は機械学習やニューラルネット、大規模言語モデルなど、AIの幅広い分野で訓練を積んでいる」とGhrist氏は説明する。AI関連職の2つ目のカテゴリーは、ビジネスや経営の幅広い役割との結びつきが強い。「これは非常に興味深い職種で、『AI+X』という形をとる。Xの部分に入る言葉は、法律、医学、教育などだ」とGhrist氏は続ける。「このような役割が増えていくが、適人者を見つけるのは骨が折れるだろう。核となる専門知識に加えて、AI導入スキルも求められるからだ」
具体的には、製造・設計部門の社員に代わり生産管理をしたり、営業社員に顧客に最適な提案を教えたりといった運用につなげる。
「プライバシー侵害の報告」に「AI生成コンテンツやその他の合成コンテンツがあなたの容姿や声に似ている場合の報告」という項目が追加された。「他のユーザーがAIを使用してあなたの容姿や声に似ている合成コンテンツを変更または作成している場合は、削除をリクエストできます」とある。
メッセージは練習を終えた午後8時半ごろに届く。投球、守備、打撃…選手が自分が抱える課題を打ち込むと、チャットボットが解決策を提示してくれる。
AIは「Copilot+ PC」の専売特許ではない。今回は画像生成AIが広く知られるのに大きな役割を果たした「Stable Diffusion」を、6月に発売されたばかりの「Copilot+ PC」で動かしたらどうなるのかを試してみることにした。
この機能は、Metaが2023年9月に発表した「Meta AI Studio」の一部であり、クリエイターや中小企業がカスタマイズしたAIチャットボットのキャラクターを作成し、Instagram上でメッセージへの返信やライブチャットをさせたりできるようにするもの。
OpenAIと米TIME誌は6月27日(現地時間)、複数年にわたるコンテンツ契約と戦略的パートナーシップを発表。ChatGPTを含むOpenAIの製品は、TIMEのアーカイブから現在及び過去101年分の記事にアクセスし、ユーザーの質問に対してより正確な情報を提供できるようになる。
「ローコード開発の目的は、アプリケーションやプラットフォームの開発を従来型のプログラミング言語に代わって、視覚的や宣言的なアプローチで可能にすることにある」
将来的には、現在の1つの問いかけに対して回答するオラクル型AIから、目的達成のため連続したタスクを他システムと連携して完了するジーニー型AI、さらには長期的目標の計画立案からタスクの実行・最終確認まで遂行するソブリン型AIが登場すると想定。同社は「(ソブリン型AIにより)最小限の人の介入で自律的にAIが業務をこなすオートノマスエンタープライズ(自律型の企業)が今後実現できる」ことを見込む。
ワークショップ受講者にはクラウドサービス「生成AI GO」のアクセス権を提供いたしますので、高性能なPC等は不要。新しい技術が比較的早いタイミングで使えるツール「ComfyUI」を利用して、ブラウザから直接参加できます。画像生成に使用するプロンプトは受講者向けにドキュメントとして公開し、その場でコピペするだけで画像生成を体験できる、非常に簡単な仕組み。生成した画像はその場で自分のPCに保存できます。
「AIは一部を機能化したものであり、AGIはAIの親玉みたいなものだ。人間が持つありとあらゆる考え方、知恵、知識を、全方位で、人間と同じか、最大でも10倍程度、上回ったものになる。AGIを目指すことが先端のAI研究者のテーマになっており、5年以内、場合によっては3年ぐらいでAGIの時代が訪れ、すべての人類の知恵を抜くことになるだろう。だが、それは一番賢い人間と同等のものであり、そこを目指しても意味がない。AGIが、脳の神経細胞のようにつながり、人間の1万倍賢くなる。それがASIである」と定義した。
AI生成動画のクオリティは劇的に高まっており、今後もどんどん改善が進むだろう。ただ、今のところ最も出来のよい生成結果であっても、登場人物の姿が変容していく傾向があり、まるで高熱を出したときに見る奇妙な夢のような動画が生み出されている。
今回のCopilot+ PCも、そのパターンに準拠し、Windows Home Editionに、MicrosoftのAIであるMicrosoft Copilotを筆頭に、コクリエイター、リコール機能、Windows Studioエフェクト、ライブキャプションといったAI機能を提供するアプリを添付したOSが各社に提供され、それをプリインストールして出荷されることになる。具体的には、OSそのものはWindows11だが、インストールされているのがCopilot+ PCであることを検知されると、これらのアプリが有効になるという建て付けになっているそうだ。
Forresterの調査では、米国の86%もの従業員がAIと自動化に多くの人が仕事を奪われると危惧しており、約3分の1(31%)はこのトレンドが2~5年以内に顕在化すると考えていることが明らかになった。
「ソフトバンク」「ワイモバイル」「LINEMO(ラインモ)」のユーザーを対象に、新時代のAI検索エンジン「Perplexity」の有料版「Perplexity Pro(パープレキシティ・プロ)」(通常価格は月額2950円から、年額2万9500円から)の、1年間の無料トライアルの申し込み受け付けを開始した。
Google AI Essentialsは、仕事で生成AIを活用し、キャリアアップを目指す人のためのGoogle独自の資格認定プログラム。生成AIに関する事前知識は不要で、生産性向上のためのAIスキルを習得できる。AIの基礎知識から実際の仕事の場面を想定したビジネスへの応用まで、10時間以内で学習できるオンラインのプラグラム。通常は有料だが、Googleが主幹事を務める日本リスキリングコンソーシアムの新規会員を対象に、同プログラムを無料受講できるアカウントを先着1万名に配布する。プログラムを修了すると、修了証書が発行される。
AI Overviewsは、生成AIを活用し、検索キーワードについて、Webの検索結果をもとに、独自のまとめを自動で生成、ユーザーに提示する機能。検索後に、ウェブサイトに移動せずに検索結果だけで概要を把握できる点が特徴で、米国で5月末からスタートした。
例えば、「東京タワーとエッフェル塔の類似点は何ですか?」といった質問を入力すると、パープレキシティはウェブ上の関連情報を収集・分析。「両者ともに鉄塔であり、東京タワーはエッフェル塔をモデルとしている。高さは東京タワーが333m、エッフェル塔が330mで、ほぼ同じ高さを持つ」といった回答を提示する。単なる情報源へのリンク一覧ではなく、ダイレクトに回答を提供することで、ユーザーは手間をかけずに欲しい情報を得られる。また、回答に情報源を明示することで、内容の信頼性も担保しているという。
Copilot+ PCは、マイクロソフトが5月に発表したAI向けPCの新カテゴリー。マイクロソフトはCopilot+ PCを、直近10年のWindowsプラットフォームにおける最も大きな変化と表現している。
「Copilot+ PC」は、Microsoftが“これまでで最も高速でインテリジェントなWindows PC”と謳う、新しいPCクラス。端末上で直接AIを実行できることから“次世代AI PC”とも称される。
最も生成AIによって置き換えられやすいのは「人 vs データ」の仕事だと僕は考えます。たとえば、生成AIはコードを書いたり、プログラミングを組んだりするのが得意です。まさにそれらを生業とするソフトウェアエンジニアが日本には大勢いますが、こうした仕事は、生成AIに置き換えられる可能性が高い。
使い方を工夫すれば、強力な翻訳ツールになるはずだ。本記事では、英文をChatGPTで扱う上での具体的な活用方法について、4つのアプローチを紹介したい。なお、検証には無料プランでも利用できる「ChatGPT 3.5」を使用している。
生成AIの世界においてOpenAI、Microsoft、Googleが覇権を争う中、Appleはこのジャンルにおける開発成果を“一切”披露しては来なかった。しかし一方で、AppleはAI関連のデータ共有プラットフォーム「Hugging Face」を通して言語モデル「OpenELM」を公開するなど、オープンソースコミュニティーではむしろ生成AIに積極的な姿勢も見せている。
生成AIの技術により、顧客の効率性や創造性、生産性を高め、ビジネスを加速できる。特に、コンテンツ制作、ソフトウェア開発、VRの適用によるデジタルツイン構築支援、ナレッジマネジメントの4つの領域にフォーカスし、オフィスワーカーとフロントラインワーカーの生産性向上とビジネス変革を目指す。
自社で独自開発した生成AIシステム「アップルインテリジェンス」も発表し、マイクロソフト(MS)やグーグルなどに後れをとっていたAI戦略で巻き返しを図る。
白書では、23~28年の国内のAI市場が年平均30%の成長率で推移するとの調査結果を紹介。新材料の研究から家事用ロボットの開発まで、AIが幅広く使われている事例を取り上げた。
新しいテキストや画像などのコンテンツを作成するために使用できる人気の高いツールは既に複数ある。たとえば、ChatGPT、Claude3(クロード3)、Gemini(ジェミニ)、Perplexity AI(パープレキシティAI)、Microsoft Copilot(コパイロット)、Midjourney(ミッドジャーニー)、Dall-E3などの名が挙げられる。これらは、営業・マーケティング、オペレーション、財務、事業開発などの経営レベルの機能など、中小企業のさまざまな分野で活用できる。
AIモデルは人間のモデルとは異なり、スケジュール調整や撮影に時間がかからない点がメリットとして挙げられている。AIモデルを扱うAI model株式会社のホームページを見ると、モデル撮影のコストを最大70%削減できるとあり、メリットが強調されている。
AMD、Intel、NVIDIA、QualcommによるCOMPUTEX 2024の基調講演は、データセンターでのAIにフォーカスを当てたNVIDIAは別にすれば、AMD、Intel、Qualcomm3社ともにAI PCやCopilot+ PCがメインだ。QualcommにArm ISAのアーキテクチャライセンスを供給しているArmも、話題の中心はArm版Windowsだった。
セガサミーホールディングスは、自社の製品画像を学習した画像生成AI環境を構築し、特定の商品デザインに生かす実証実験で、デザイン案の件数を、従来の100倍に増やすことができたと発表した。また、同製品に関するアンケートで、自由記入欄に寄せられた大量の意見について、背景にある感情まで生成AIが抽出・分類し、製品改善案の提案を行うシステムも構築。アンケート分析業務が約80%の効率化したという。
人工知能(AI)は、DevOpsの取り組みをフラジャイル(脆弱)からアジャイル(俊敏)へと変える助けになるだろうか。AIはソフトウェアのコード生成だけでなく、それに伴うすべての作業、たとえば仕様策定、文書化、テスト、展開などを大幅に加速する可能性がある、との見方が業界全体に広がっている。
同社 業務執行役員 モダンワークビジネス本部 本部長の山田恭平氏はAIについて「AIの筋トレがとても重要。AIは意識せずに使えるインフラではなく、既にスキルに分類されている。仕事に役に立つプロンプトもほかの人が同様に役立つとは限らない。だからこそAIスキルを磨くため、(Copilot for Microsoft 365を)使えば使うほど、組織の変化を感じられる」と述べた。
米国では昨年、利用できるようになっていたが、今回、グーグルの生成AIモデルのひとつ「Gemini 1.5 Pro」を取り入れた「NotebookLM」が、日本を含む世界200以上の国と地域で、日本語を含む35以上の言語で利用できるようになる。今後は100以上の言語がサポートされる予定。
AIのビジネスにおける活用はこの半年で急速に広まっており、調査によると職場でAIを活用している社員のうち46%が直近半年以内で使用し始めたという。職場でのAI利用率は世界平均で75%だが、日本では言語の壁や生成AIサービスの成熟度などが影響し、32%と未だに低い状況にある。
これまで、商品レビューに関しては「Yahoo!ショッピング」に投稿されている該当商品の各レビューを一覧で表示していた。AI要約機能では、生成AIがYahoo!ショッピングに投稿されている商品のレビューからユーザーに評価された「良い点」と「悪い点」を抽出し、それぞれの要約を最大5件ずつ表示する。
「chatgpt4oに近所のスーパーの電子チラシを読ませて1番安く仕上がる献立を作らせてみた」と、無課金ユーザーも使える最新モデル「GPT-4o(GPT-4Omni)」に献立を考えてもらった結果を共有しています。「可能な限り安く済ませて欲しい」「男性1人、女性1人、幼児1人分作って欲しい」「可能な限り統一感(和食、中華といった)が欲しい」「レシピの試算金額を出して欲しい」「主食は家に在庫あり」など具体的な条件を指定しました。
提携により、両社は「日立の全社トランスフォーメーションの推進」「革新的なデジタルソリューションの開発」「サステナブルな成長をめざした共同プロジェクトの開始」「デジタル人財育成の強化」の4分野において取り組みを進める。
現地時間6月5日から16日まで、ニューヨークで開催される「トライベッカ映画祭」において、OpenAIの動画生成AIモデル「Sora」を使って制作された短編映画が上映されることがわかった。
ChatGPTとClaude 3はどちらも無料プランを用意しているが、上位のAIモデルを利用できないという制限がある。有料プランの価格は、「ChatGPT Plus」と「Claude 3 Pro」が月額20ドル(約3144円)、「ChatGPT for teams」と「Claude 3 Team」が月額30ドル(約4716円)となる。
コタツ記事は、いまやスポーツ紙や芸能誌のデジタル版のメシの種らしい。その名の通り、コタツに入ったままでテレビで見たことをそのまま書けばできてしまう、レベルの低い記事だ。
今年前半の生成AI各社のアップデートが一通り出そろいました。米OpenAIの「GPT-4o」、米Googleの「Gemini Ultra」。そして、少し前の3月にアップデートされていた米Anthropicの「Claude3 Opus」が、今の生成AIの“御三家”といったところでしょうか。
OpenAIは5月30日(現地時間)、大学向けに設計された「ChatGPT Edu」を発表した。同社の最新LLM「GPT-4o」をベースにテキストと画像を処理、データ分析などの高度なツールも利用可能にも関わらず、教育機関にとって手頃な価格設定となっている。
Yahoo!知恵袋では、生成AIがユーザーの質問に答えるAI回答機能を2023年11月から提供しており、現在457カテゴリの質問で利用可能となっている。AIモデルにはこれまでOpenAIのGPT-4が用いられていたが、今回新たにClaude 3が加わることになり、今後はGPT-4、Claude 3の両方から回答が得られるようになる。
米Microsoftは5月30日(現地時間)、「スマートフォン連携」(Phone Link)のアップデートを発表した。メッセージへ返信する際、AIがインテリジェントにその内容を提案してくれる「Suggested Replies」機能が、Android向けに提供される。
複数の対話型生成AIに指示を出してウイルスの設計情報を回答させ、組み合わせて作成したという。生成AIを使ったウイルス作成の摘発は全国初とみられる。
全ての人がAI(人工知能)エージェントを持ち、人生のパートナーとして育て、共に成長していく――。コンサルティング世界大手のアクセンチュアは、世界の生成AIの技術動向をまとめた最新調査レポートで、こんな近未来像を提示した。人の意図や好みを理解したAI同士が、人間に代わってコミュニケーションやビジネスを進める新たな世界が始まり、「企業は顧客との向き合い方を根本から変える必要がある」と指摘する。
OutlookでもCopilot for Microsoft 365を利用できる。新規メールを作成する「メッセージ」タブを開くと、「Copilot」アイコンが表示される。アイコンをクリックすると、「Copilotを使って下書き」と「Copilotによるコーチング」という2つのメニューが表示される。
先ごろ開催されたマサチューセッツ工科大学(MIT)のイベントで講演したペンシルベニア大学ウォートン・スクールの経営学教授Peter Cappelli氏の言葉だ。生成AIとLLMは、トータルで考えると、業務を軽減するよりも多くの仕事を人々にもたらすかもしれない。LLMの実装は複雑で、「生成AIにやらせることもできるが実際にはそこまでする必要のない作業が数多くあると分かっている」と同氏は述べている。
「Be My Eyes for Windows」では、AIとの自然言語による会話でデスクトップ上のグラフィックを解説可能。アプリケーションのユーザーインターフェイスやWebページのレイアウトを解説できるほか、ローカルの画像をアプリにアップロードして解説したり、Web上の画像も解説できる。
グーグルは5月14日(米国時間)に開催した開発者向けイベント“Google I/O”で、音楽生成AI「Music AI Sandbox」を発表した。本連載でも昨年、グーグルが音楽生成AIの「MusicLM」を発表したことに触れた。また、Metaも音楽生成AIとして「Audiobox」を発表。AI大手のStability AIも「Stable Audio」をバージョン2.0に進化させている。
あらゆる業界で人手不足が叫ばれる中、家電量販店最大手ヤマダホールディングス(HD)がAI(人工知能)ロボットを使った接客サービスの実現に乗り出した。ANAホールディングス発のスタートアップと業務提携。家電流通の枠を超えたサービスの横展開も視野に入れる。KDDIも米国ドローン大手と提携し、ローソン屋上などをドローン基地にして全国どこでも10分で駆け付けられる仕組みづくりを検討するなど、深刻化する人手不足を、AIを軸にしたテクノロジーで解消しようとする動きが相次いでいる
OpenAIの新型AIモデル「GPT-4o」で特に注目すべきは、動画理解や音声処理能力です。たとえば45分の専門家向け講義動画をGPT-4oに入力し、数分で正確に要約する能力を示しました。さらに、高品質な画像生成や3Dオブジェクトの生成までこなします。
同様の見解は、司法の場でも示されている。東京地裁は今月16日、AIを発明者とする特許出願を特許庁が却下したのは違法だとして、米国人の技術者が国を相手取って却下処分の取り消しを求めた訴訟で、「特許法が規定する『発明者』は自然人に限られる」として請求を棄却した。
Microsoftの人工知能(AI)アシスタント「Copilot」について、「Windows」向けのデザインの見直しが進められている。その目的は、同アシスタントへのアクセスと利便性の改善だ。現時点で、Windowsではサイドバーから「Copilot in Windows」を利用できるが、これが近く、サイズ変更や場所の移動が可能な、通常のWindowsアプリになる。
グーグルがGemini推しでマイクロソフトがCopilot推し、というと「それはまあ当然だろう」と思う人も多そうだ。だが、5月20日からシアトルで「Build 2024」に関わる取材をしてみると、マイクロソフトは当然ながら、マイクロソフトらしい生成AIへの取り組みをしていた。中核となるのは、Windows11でのオンデバイスAIへの取り組みを強化する「Copilot+ PC」だ。
「Gemini(ジェミニ)」と呼ばれる生成AIの技術を導入することで、グーグル検索がユーザーの知りたいことをずばりと教えてくれるようになるという。既に昨年から「SGE(Search
Generative Experience:検索生成体験)」という呼称で提供されてきたが、これは試験的なサービスだった。このSGEを今回、商品化して「AI Overview」という正式名称で提供するという。
単にキーワード検索すると従来と同じようにリスト化されたサイトが表示されるが、
これに対し「電気自動車の現状を詳しく教えて」とリクエストすると、今度はAIがその解答をコンパクトにまとめた文章として返してくる。
判決によると、出願者は数年前に、発明者を「ダバス、本発明を自律的に発明した人工知能」と記載し、特定装置に関する特許を出願。特許庁は「発明者として記載できるのは人に限られる」として修正を命じたが応じなかったため、出願を却下した。
無料ユーザーもGPT-4oを使えるため、記者も実際にウェブサイトで試した。まずはアカウントを作成し、メッセージ画面を開いた。「無料ユーザーでもGPT-4oを使う方法を教えてください」とチャットすると、すばやい返答が返ってきた。
生成AIを利用するときに利用頻度が高いプロンプトが複数ある場合は、クリップボード履歴ソフト「Clibor」が便利だ。Cliborで、Copilotのプロンプトを手軽に管理、入力する方法を紹介する。
AIは次世代のスタートアップの中核にあり、新しいビジネスアイデアの創出から市場投入までの時間を大幅に短縮することで、機敏性と破壊的な優位性をもたらす。技術者は、このAIを活用する新世代のビジネスの構築と立ち上げにおいて、重要な役割を果たすことができる。
対話型AI(人工知能)サービス「ChatGPT」の最新モデル「GPT-4o」は、まるで人間と話すかのようにリアルタイムで滑らかに会話ができる。開発会社の米OpenAIが披露した動画では、GPT-4oと会話するほか、AIが笑ったり歌ったりする機能を紹介した。
通話音声の変換は、ソフトバンクの新規事業提案制度「ソフトバンクイノベンチャー」から生まれたアイデア。AIの感情認識・音声加工技術を活用して客の声を穏やかなトーンに変換することで、オペレーターの心理的安全性を確保しながら、顧客との良好な関係性の維持を目指すという。
5月14日未明に発表された超絶高性能化したChatGPTの新バージョン「GPT-4o」は、無課金勢にも開放されると聞いて大喜びしたはいいけど、「なんか俺のChatGP、前のまんまなんだが」というあなた。実はもうあなたも、すでにウワサのGPT-4oを使えるようになっています。
例えば、「多くの斑点があるクラゲが水中を泳いでいる。彼らの体は透明で、深海で光る」などと入力すると、実際に撮影されたかのような高画質の画像を生成する。将来的には、傘下の動画投稿サイト「ユーチューブ」のショート動画などにベオの機能を搭載するとしている。
AIスーツケースは、視覚障害者の移動を支援する自律型ナビゲーションロボット。同館館長でIBMフェローでもある全盲の浅川智恵子氏が出張の際に、「スーツケースが自動で道案内をしてくれたら」と感じたことをきっかけに開発が始まった。見た目は普通のスーツケースだが、内部にコンピューターやセンサー、モーターなどが組み込まれており、人や障害物を避けながら、目的地まで安全に案内してくれる。
Veoは自然言語を高度に理解し、「タイムラプス」や「航空写真」などの用語を理解できるという。一貫性のある映像を作成でき、人や動物、物体がリアルに動く。公式ブログでは、雨の夜のアスファルトやサファリを歩く手編みの象のぬいぐるみ、海中を遊泳するくらげなど、Veoで生成した動画が紹介されている。
13日のライブ配信イベントで披露された新しい大規模言語モデル(LLM)、GTPー4oは膨大な量のデータをインターネットから取り入れて学習し、リアルタイムでの文字情報や音声、画像の扱いが優れている。数週間内にリリースされる見通しシステムに話しかければ、わずかミリ秒で音声で返答し、流れるような会話が可能になると、オープンAIは説明。同様にプロンプト(指示・質問)として画像をシステムに見せれば、画像で応答できるという。
米OpenAIは5月13日(現地時間)、大規模言語モデル(LLM)「GPT-4o」を発表した。同社最新のフラッグシップモデルで、従来の「GPT-4 Turbo」と比べ2倍速く、50%安価となっている。
Synthesiaは4月、人間のようにさまざまな感情を表現できるアバター「Expressive Avatars」を発表した。これは同社が「デジタル俳優」と呼ぶ技術の最新版だ。表情が強化され、リップシンクもより正確になっている上に、口調も人間のようにリアルで、多くの音声読み上げAIのロボット的な口調よりも優れている。
ChatGPTの基本的な扱いに慣れてきたら、さらに便利に使うために「プラグイン」の活用を検討してみよう。要するに、ChatGPTをより便利に使うために用意された拡張機能のことだ。こうしたプラグインを使うためには、そもそもChatGPTを有料プランにせねばならず、料金がかかる。前提知識なしで導入しようと決断するのはハードルが高いはずだ。そこでまずは、本稿で解説する手順の流れと、できることの全様を把握しておき、そのうえでチャレンジするかどうかを検討してみてほしい
サム・アルトマンCEOは自身のXアカウントで「gpt-5でも検索エンジンでもないけど、皆さんに気に入ってもらえるであろう新作にがんばって取り組んできた! マジックみたいだと感じた」とポストした。
人気歌手や声優の声を無断でAIに学習させ、無関係な歌を歌わせたり、セリフを言わせたりする無断AIカバーは、アニメファンなどが好きなキャラの声で勝手に制作し、動画SNSなどで人気を集めている。
TikTokによると、動画配信プラットフォームで、アプリ外で生成された動画や画像が識別できるように自動でラベルを付与する取り組みは初めて。
AI時代になり、テクノロジーを専門とする人の興味深い職務が新たに生まれているが、実績のあるコーディングや統合のスキルをまだ捨て去ってはならない。むしろ、「従来型」のテクノロジー活動と考えられているものが、AIによってさらに高速かつ生産的に進む可能性がある。
米Microsoftは8日(現地時間)、生成AIサービス「Copilot for Microsoft 365」の機能拡張を発表した。同サービスのプロンプトでオートコンプリートが利用可能となるほか、ボタンクリックでよりリッチなプロンプトに変換したりするなど、入力自体を生成AIがアシストしてくれるようになる。
医師による退院時サマリー作成業務、看護師による退院時看護要約作成業務などの事務的な業務において、あらかじめ設定しておいたプロンプトに沿ったAIによるサマリーの作成や、書類の画像データから電子カルテに記載できる形への編集が可能。ほかにも、音声データからの書き起こしや議事録の作成、電子カルテの記載文の生成、投入した文章から、医学用語や院内用語などを反映した文章の生成・要約なども可能となる。
首脳会談などの同時通訳では、熟練の通訳者が話者の発言の途中から翻訳を始める。作業の負担は大きく、日本語と英語の同時通訳者は国内で数百人に限られる。NICTのチームは同時通訳者の協力を得て、用意した膨大な文章データのうち、通訳者が翻訳を始めるタイミングをAIに学習させた。用語集などと組み合わせることで、日英中韓仏の5言語で双方向の同時通訳ができるAIを開発した。
AIカカクは、販売実績や天候・客数などの環境条件を学習したAIが“その日その時”の需要を予測し、バーコードで読み取った商品情報と陳列数をもとに適切な割引率を提示するシステム。
今回、録音した鳴き声をAIに検知させて生息状況や範囲を特定することで、調査の省力化を図る検証を行った。横浜市内の「こども自然公園」内の5カ所にボイスレコーダーを設置し、2024年2月19日から3月29日にかけて鳴き声を収集。AIで音声を解析した。
Jump Aheadは、人工知能(AI)を使ってユーザーが見たいものを推測し、他の視聴者の多くが先にジャンプした箇所を分析すると、Android Authorityは説明している。YouTubeは、この機能の仕組みを詳しくは明らかにしなかったが、AIが何らかの視聴データを判断材料にしている可能性が高そうだ。
「ChatGPT」を手掛けるOpenAIはGPT-4 Turbo with VisionのAPI提供を開始したり、動画生成AI「Sora」を発表したり、アジア初となるオフィスを東京に構えるなど、相変わらずものすごいスピードで進化し続けている。3月、ChatGPT越えを謳うAnthropicの生成AI「Claude 3」がリリースされた。
日本経済大学とWHITEは、OpenAIの生成AI「ChatGPT」を搭載したバーチャルアシスタントを、授業中の「TA」(Teaching Assistant:教員助手)として活用する実証実験を開始した。教員不足が叫ばれるなか、AIによって授業の質の向上と教員の労働負担の軽減をめざす。
フランス発のテックスタートアップ、Veesual(ヴィジュアル)は、AIを駆使した画像生成技術でファッションeコマースの体験に変革をもたらしている。直感的なスワイプ操作で実現するバーチャル試着体験は、オンラインでのショッピングを革新し、ユーザーに前例のない試着体験を提供する。
ChatGPT、特にGPT-4が登場して以来、大規模言語モデル(LLM)の性能向上において、パラメータ数を増やすアプローチが主流となってきた。しかし最近では、パフォーマンスを維持しつつ、パラメータ数を減らす、小型モデルの開発が活発化している。この大規模言語モデルの小型化において、水面下で動いているのがアップルだ。
岸田文雄首相は2日、訪問先のパリで、生成人工知能(AI)の安全な利活用に向けたルールを形成する国際的な枠組み「広島AIプロセス・フレンズグループ」の設立を表明した。経済協力開発機構(OECD)加盟国を中心に49カ国・地域が参加する。
昨年度の冬休み、中1の生徒に英語で日記を書く宿題を出したところ、現在完了形など教えていない英文法が使われ、ミスもない「素晴らしい英文」の日記が、何人もの生徒から提出されてきたのだ。生成AI(人工知能)が使われたことは疑いようもない
巧克力が見つめながら話す内容といえば「なぜ今、多くの男性が一人で生きることを選ぶのですか?」「性格の良い男性は社交的ではありません」「孤独を楽しめる男性は、普通の人ではありません」「男性をあまりにも長い間一人にしておくと、機会があっても孤独を選ぶでしょう」といったまるでスナックのママかのように傷ついた男性を癒やすようなものだ。
労働力不足が深刻化する中、現場の状況を把握できるIoT機器と生成AI(人工知能)などを組み合わせて省力化につなげる取り組みが進んでいる。生成AIの活用で、これまでパソコン(PC)操作が必要だったセンサーデータなどの情報収集が、チャットとの自然な対話で確認できる新技術が登場。建設現場の管理や公共トイレの点検を効率化するシステムが相次ぎ市場投入され、移動時間の削減や人員配置の最適化を支援している。
日本経済新聞社傘下の英経済紙Financial Times Group(FT)は4月29日(現地時間)、米OpenAIとの戦略的パートナーシップとライセンス契約を発表した。これにより、FTのコンテンツでChatGPTを強化し、モデルの有用性を向上させ、新たなAI製品と機能の開発でFTの読者向け機能の開発で協力していく。
マーケティング分野で生成AIの導入が進む一方、使いこなせなかったり、担当者によってアウトプットの質がばらついたりする課題があるため、マーケGAIを展開する。400社以上のAI活用支援の実績がある同社のプロンプト(指示文)開発チームが40種類の業務特化型プロンプトを実装。同社のマーケティングDX支援サービス「DECA」の事業責任者が監修した。
本サービスは日々の営業活動をAIが分析し、蓄積したデータを活用して売上ポテンシャルの高い顧客を提示。馴染みのある行きやすい顧客に訪問するのではなく、成約見込みが高い顧客に訪問することで、戦略的な営業活動の実現を支援するという。
参加した児童生徒からは、生成AIが便利であることを理解しつつ、使い方に気を付けなければいけないことや「AIを利用する側」として活用できるようにしていきたいとの声が聞かれた。
インターネットが、オフラインおよびオンラインのどちらもで児童に対する性的危害を加速させたのと同じように、生成AIの悪用は児童の安全に深刻な脅威をもたらしており、既に被害が発生していると指摘している。生成AIにより、大量のコンテンツ作成がこれまで以上に簡単になっている現状を踏まえ、1人の加害者が児童性的虐待コンテンツを大規模かつ迅速に作成できるになったという。
TBSの報道によると、「世界では今、インプットされたデータから文章や画像などを自動で作り出す『生成AI』の技術が急速に進化しています。こうした中、中国では『生成AI』を使って、亡くなった人を『復活』させるビジネスが登場し、論争を呼んでいます」という。
「インテル Future Tech アイデアソン」は、インテルのCore Ultra プロセッサーと「OpenVINO」ツールキットの組み合わせを利用し、AIを使った新しいアプリの開発を目指すアイデアを競うアイデアソン。開発者コミュニティーの育成と、インテルの技術を活用して社会的課題に取り組む未来を作る開発者たちを支援することを目的としている。
生成AI(人工知能)の台頭により、医療分野でもAIの活用が注目されている。AIは、医療現場で欠かせないデータ分析や診断、業務の効率化・向上に貢献しているが、特に活用が進んでいるのが画像診断分野だ。ディープラーニング(深層学習)との親和性が高くAIを使った画像処理技術の開発で、各社がしのぎを削っている。
例えば、筆者は下部のブロックに「なるべく端的に、日本のビジネスシーンを想定した表現で回答してください」や「回答の冒頭において、指示や質問に対する返事や、あいさつなどは不要です」といった文を箇条書きで記した。この状態で、ChatGPTに指示/質問をすると、条件を反映してくれるというわけだ。
新開発されたラインアップのうち「cotomi Pro」は、GPT-4やClaude 2などのグローバルトップレベルのモデルに比肩する性能を、GPU2枚の現実的なインフラで、GPT-4のおよそ1/8のレスポンスタイムで実現できるという。
新たに実装される「画像を生成(Generate Image)」機能を使うと、プロンプト“だけ”で画像を新たに作成できる。「参照画像」は、塗りつぶしをする際に別の画像を参照する機能だ。例えば、服の画像を読み込ませた上で全身ポートレートの服の部分に塗りつぶしを指示すると、生成AIがその服に“着せ替えて”くれる。写真を撮り直すことなく、一部のオブジェクトを差し替える際に便利そうだ。
プロンプトの作成にあたっては主に4つの点を考慮すべきだという。具体的には、情報を得ようとしている人を指す「Persona」(ペルソナ)、チャットボットに依頼したい内容を示す「Task」(タスク)、AIチャットボットがタスクの実行に利用できる追加情報を意味する「Context」(コンテキスト)、そしてアウトプットをどのように構成するのかを指示する「Format」(フォーマット)だ。
画像をアップロードして質問できるが、手持ちの写真について質問するならBing Copilotを使えばいい。EdgeのCopilotでは、スクリーンショット機能を活用したいところだ。プロンプトの入力フォームにある「スクリーンショットを追加」アイコンをクリックすると、画面領域の選択モードに切り替わる。ドラッグしてアップロードしたい部分を選択し、チェックマークをクリック。あとはプロンプトを入力し、飛行機アイコンをクリックすればいい。
「パラメータ」と呼ばれる変数を指定することで、出力される回答の傾向をコントロールできる。本稿ではChatGPTですぐに試してみたくなるパラメータについて、3つの例を紹介しよう。
AIが自律的に行った発明に対し、特許権を認めるかの是非については、80%が「問題をもたらす恐れがある」と回答した。実際に製品化などにつながるか検証されない発明が増えるほか、特許の出願数が過剰となり、審査が遅れるとの指摘も相次いだ。
日本法人の開設にあわせて、日本語に最適化したGPT-4のカスタムモデルも公開した。日本語文章の翻訳と要約のパフォーマンスおよびコスト効率が向上し、前モデルと比較すると最大3倍に処理速度が高速化した。
「OneNote」のインク機能で急いでメモを取ると、文字が斜めになったり、上下左右に乱れて、あとから読みにくくなることがある。これを整頓して、読みやすくするのが今回導入された機能だ。友人にノートを共有したいが、汚い手書きテキストを見せるのが恥ずかしいといった場合にも役立つ。
生成AI活用者に生成AIの用途を聞くと、会計事務所では「文書の生成(作成)を頼む」が61%、「調査、検索を頼む」が43%、「アイデアを聞く」が42%、その他「プログラムコードの作成・生成、デバッグ」「画像生成、画像処理」などに利用。企業・事業主では、「文書の生成(作成)を頼む」が63%、「調査、検索を頼む」が57%、「アイデアを聞く」が42%、その他「Excelの式作成のアシスト」「文章の校正」などとなった。会計事務所、企業・事業主ともに文書の生成(作成)を目的とした利用が最多だった。
切り札になるのが日本語に最適化した「GPT-4」ベースのカスタムモデルだ。日本語の翻訳と要約の精度を高め、コストパフォーマンスも意識した。動作速度は前モデル比で最大3倍速くなるという。今後、数カ月以内に外部デベロッパも利用可能なAPIとして提供を予定する。
日本向けの機能として公開されたのが、GPT-4を日本語に最適化して「GPT-4 日本語カスタムモデル」だ。このモデルは日本語文書の翻訳や要約、使用トークン数を軸としたコスト効率が最適化されている。
自らの知的・創造的な能力を売りにする職業は、プロフェッショナルとしての自立性や独自性を重んじるため、部分的にAIに頼ることに「自分の価値や貢献が疑問視されるかもしれない」との不安を抱くことになるという。
結果が表示されるまで30秒(実質的には40秒くらい)かかることから、「遅すぎ」と酷評されることも多いが、用途によってはディープ検索を使った方が調べやすいこともあり、通常の検索と使い分けるのが良さそうだ。
「インターネット以来の発明」とも言われる生成AI(人工知能)。海外勢を中心とした開発競争に、日本企業も名乗りを上げ始めています。NECやNTT、KDDIなどの大手企業が日本語に特化した生成AIを矢継ぎ早に投入しています。拡大途上の生成AIの現状について、海外製との違いなど素朴な疑問を新入社員がベテラン記者にぶつけてみました。
「生成AIは構想語る段階ではなく、実際にその上で動くエージェントの話をする段階に入っている」と述べ、生成AIを活用したエージェント(アプリケーションのこと)が既に顧客のITとして動き始めており、それによりデジタル変革を進めている顧客が多くいると強調した。
生成AI(人工知能)が脚本などの著作物を無断学習している可能性を踏まえ、「盗作脚本ではないか」「声優を応援できない」などの批判が相次いだためだ。専門家は「AIを使ったイベントでは権利者への配慮が必要だ」としている。
生成AIを「日常的に使っている」「ときどき使っている」と回答した153人に「定期的に利用している生成AIツール(複数回答可)」を具体的に聞くと、「ChatGPT」48.4%が最多で、以下「Microsoft Copilot Studio」21.6%、「Microsoft Copilot[旧Bingチャット]」19.0%、「Gemini(旧Bard)」15.7%、「Google Generative AI App Builder」13.7%の順となった。
人の声を再現する生成AI(人工知能)を発表した。15秒分のサンプル音声を吹き込んだ後、任意の文章を入力すると、サンプルそっくりの音声でその文章を読み上げる。ただし、悪用のリスクがあるため、しばらく一般公開を控える方針だ。
AppleのiPhone向けOSの次期メジャーアップデートは、おそらく「iOS 18」という名称になり、iPhoneに多数の新しいAI機能をもたらす見通しだ。Bloombergによると、iOS 18はAppleにとって、初代iPhone以降、最も大規模なアップデートとなる可能性があるという。
企業は現在、零細企業も含めて規模の大小を問わず、AIソリューションの実装に追われている。会社が大きくなると、統合やデータのサイロ化といった技術的な課題も大きくなり、AIの配備計画は加速が難しくなる。ITリーダーの90%は、AIとほかのシステムの統合が大変だと述べている。
RAGは、「Retrieval Augmented Generation」の頭文字をとったもので、日本語に訳すと「検索拡張生成」だ。簡単に説明すると、生成AIの言語生成能力を、検索技術と組み合わせて拡張する仕組みだ。RAGの技術自体は、以前から存在していたが、昨今、注目されるようになってきた理由は、ChatGPTのカスタムGPT(GPTs)やCopilot GPT Builder、Copilot Studio、NVIDIAが公開したChat with RTXなどの、RAGを利用可能な生成AIソリューションが増えてきたことが、その1つだ。
検索結果画面で知りたいことを確認できるため、ユーザーの利便性が高まる一方、情報を提供するWebサイトにとっては、検索経由のトラフィックが少なくなることが危惧されています。
新しいラベルの適用はフェイスブック、インスタグラム、スレッズに投稿されたコンテンツに適用されると説明した。一方、対話アプリ「ワッツアップ」や仮想現実(VR)端末「クエスト」などのサービスには別のルールを適用する。特にリスクが高い「ハイリスク」へのラベル適用は直ちに開始すると明らかにした。
「テキスト生成AIといえばChatGPT」という状況が終わったかもしれない。3月に、Anthropic(アンスロピック)から最新のテキスト生成AI「Claude 3」(クロードスリー)が登場したからだ。ChatGPTに勝るとも劣らない性能の賢いAIで、ChatGPTよりも格段に長いテキストを扱うことができるClaude 3。どんなことができて、どんな性能なのか、実際に試してみた。
同グランプリは「人間による表現手段としてのAIの積極的な活用の方向性を探り、AIを活用したアーティストを育成すること」ことを目的としたグランプリ。第一回は2023年3月、第二回は11月に表彰式が開催されている。
グーグルなど従来の検索エンジンでは、検索結果としてこのような関連したウェブページへのリンクを表示するだけだったので、ユーザーはそれぞれのページを開いて内容を確認する必要があったが、Perplexity AIはLLM(デフォルトはGPT-3.5)を使ってこれらのページの内容を要約してくれるのだ。
日立システムズの従業員は、蓄積された提案ナレッジやマーケットニーズを把握することで構想力を高めることができ、さらに、生成AIを活用したITによる自動化の加速を通じて顧客の業務課題をより高効率に解決し、顧客のビジネスイノベーションを協創する。
LLMの違いによる特性をどう使うか、ローカルとクラウド、オンプレミスでの使い分けをどうするのか、生成したコンテンツの管理と効果計測をどうするのか、といった点が求められる。LLM自体の性能だけでなく、そうした部分をどの企業がどのような形で手掛けるのか、という話につながってくる部分だ。
通訳した内容を音声で発するとともに、内容をテキストで画面に表示する。現在、日本語を含む計13カ国語に対応。AIが音声認識エンジンと機械翻訳エンジン、音声合成エンジンを用いて、即時に言語を翻訳、音声変換させる仕組み。同シリーズは心強い専属通訳としての役割を果たしてくれる。
OpenAIは米国時間4月1日、ChatGPTのウェブサイトにアクセスするだけでChatGPTを利用できるようにすることを明らかにした。同社はこの変更を世界規模で順次導入する予定だが、ユーザーが実際に変更を目にするまでには時間がかかる可能性もある。
本サービスは、少し未来のマンガ図書館を舞台に、AIである司書見習いキャラクター「会原ぴたり」との会話を通じて、利用者の趣味嗜好に合わせた最適なマンガをおすすめする。現在は、4月25日のサービス開始に向けたティザーサイトを公開中。
AIパイロットは、メディア業界に特化したAIソリューションやAI研修コンテンツを内包したサービスで、「AIをメディアでどのように活用したらいいかわからない」「AIの情報が早すぎて完全に理解できていない」「本当に効果の高いAI活用方法がわからない」といった課題に対応。実際に業界で活用される事例をもとに、コンテンツ生成をはじめとした、メディア運営業務における生成AIを活用したソリューションを提供する。
日常業務における生成AIの活用が日本でも広がる中、NTTやソフトバンクは日本語に最適化したAIの開発を進めている。オープンAIは東京オフィスの開設を通じて日本語サービスを拡充する。
アップルは、iPhoneでAIエンジンのGemini(旧Bard)を利用するための巨大な契約についてGoogle(グーグル)と交渉中だと報じられた。Bloomberg誌は、この「巨大契約はAI業界を震撼させるだろう」と書いた。
OpenAIは、こうした合成音声が悪用される可能性を認めており、広範囲にリリースをするかどうかを検討するために、慎重にテストを行っているという。広くリリースするためには、音声認証システムの廃止や、個人の声を保護するポリシーの確立、AIの機能と限界についての一般の理解促進などが必要だとしている。
深夜の人気トーク番組「ザ・トゥナイト・ショー」でも取り上げられたCalmara(カルマラ)と呼ばれるアプリは、ユーザーが性器の写真を送ると60秒でヘルペスや梅毒、HPVなどの10以上の病気や感染症の有無を96%の精度で検出できると主張している。
企業の生成AI活用における課題として、プロンプト(AIに対する命令文)を書くスキルに応じて、得られる結果にバラツキが出てしまうことを挙げる。一方で、Slack AIは基本的にマウス操作だけで生成AI機能が利用でき、「プロンプトを書く必要は一切ない」と説明する。
VLOGGERにより、あらゆる種類の創作が可能になるかもしれない。最も単純なレベルでは、ヘルプデスクのアバターに大きな影響を与える可能性があると示唆している。リアルに合成された人間が話す動画は「共感を育む」ことができるからだという。同チームは、この技術が「オンラインコミュニケーション、教育、パーソナライズされたバーチャルアシスタントの強化など、全く新しいユースケースを実現する」可能性があるとしている。
診察中に患者との会話内容をリアルタイム音声入力を行い、その内容をもとにAIが10秒ほどで診察に関連する情報のみを抽出してSOAP形式の診察記録原稿を作成し、医師は最小限の原稿確認と修正でカルテ作成ができる。
「将来のオンラインバンキングでは、デジタルのパーソナル担当が、投資、税の管理、住宅ローン、保険などのさまざまなオプションを顧客一人一人に合わせた形で提供し、家計の管理なども支援するだろう。ヘルスケアのアプリでは、デジタルのアドバイザーが健康やウェルネスについてのお勧めをしたり、医師との約束をとったり、顧客が望む成果を得られる製品を探したりしてくれるようになる」
1つ目の機能は、その土地に詳しい人々のお気に入りの場所を知ることができる機能だ。都市名で検索するだけで、Googleマップのコミュニティーによるおすすめのリストのほか、旅行ガイドサイト「Lonley Planet」や、レストランの検索と予約のサイト「OpenTable」などの人気サイトが提供するリストを閲覧できる。
2024年度から企業の生成AI活用が本格化する中で、72%の企業が国産LLMに期待を寄せているという。導入企業における生成AIの利用方法は、Webブラウザ経由で生成AIサービスを利用するのが最も多く60%で、次いで生成AIやクラウドのベンダーが提供するAPIを利用するパターンが44%であった。
tsuzumiは、NTTが2023年11月に発表した国産LLMだ。特徴の1つはモデルを大幅に軽量化した点で、パラメーター数は軽量版で70億と、OpenAIが提供する「GPT-3」の25分の1程度しかない。2つ目の特徴は「世界トップレベルの日本語処理能力」だ。3つ目の特徴は高いカスタマイズ性だ。4つ目の特徴は、クローズドな環境で運用できる点だ。
「生成AIはIT業界だけでなく、全産業、さらには世界のあらゆる活動に大きな影響をもたらすテクノロジーだと捉えている。そのインパクトはかつての産業革命を超え、人類史上これまでにないイノベーションをもたらすのではないか。企業にとっては、このテクノロジーをいかに活用していけるかどうかが、今後の盛衰を決めるといっても過言ではないだろう」
次世代サービスステーションでの「新サービスの施策立案」で先行利用され、実験店舗のサービス検討に際し、地域住民の潜在ニーズの把握、より収益に貢献できるサービス、特色あるサービス候補の洗い出しなどに活用されたとのこと。
写真編集にAIを使用することで、写真に芸術的な効果を追加することが可能になる。たとえば、画像の背景を変更することができる。さらに「スタイル変更」ツールにより、ユーザーは自分の写真のスタイルを変えることができ、新鮮で芸術的な外観を与えられる。さらに「画像拡大」機能により、ユーザーは全体の画像を拡大し、必要に応じて写真のサイズを調整することができると報告は述べている。
NECと国立大学法人東京医科歯科大学が、スマートフォンやタブレットで撮影した映像や問診データをAIで解析、慢性の非特異的腰痛(慢性腰痛)のセルフケアを支援する技術を開発した。慢性腰痛を持つ人が、いつでもどこでも自分自身で手軽に腰の状態を確認し、推定される原因と推薦される改善運動を参照できるようになるという。
アカウント登録をすれば、無料で利用できる。女性ボイスライブラリ「田中傘」(たなかさん)も引き続き無償で提供されるとのこと。「VoiSona Talk」と「田中傘」を用いて出力した音声波形データは、個人・法人、商用・非商用を問わず、一部例外を除いて原則無料で利用できる。
利用経験率は33.5%(前回は16.6%)で16.9ポイント上昇した。しかし、その半数以上が利用頻度について「ほぼ使わない」と回答している。これについて、GMOリサーチでは、「生成AIを利用してみたものの、その半数以上が活用できていないという課題も見えた」と分析している。
これまでは、たとえば撮影した写真などを元にテクスチャーを作っていく形だったが、これに加えプロンプトを入力してFireflyに生成させることができるようになる。Fireflyで生成させたコンテンツも、凹凸具合や光沢などのパラメーターを調整できるため、写真素材がなくても、より制作者自身が作成したいものを制作できるようになるとしている。
企業の生成AI活用において、マイクロソフトが“AIを使う”ために用意するのが、「Copilot for Microsoft 365」を中心としたマイクロソフト製品に組み込まれた生成AIサービスであり、“AIを創る”ために用意するのが、ローコード・ノーコードでの独自のCopilotを構築するための「Copilot Studio」や、Azure上で展開する生成AIサービスである「Azure OpenAI Service(AOAI)」となる。
これは2023年末に刷新したAI国家戦略「National AI Strategy 2.0(NAIS 2.0)」に基づくもので、GPUの確保、AI開発センターの開設、人材育成、企業誘致などに活用されるという。シンガポールはAI国家戦略の刷新にあたりAI分野への強力なコミットメントを表明しており、この投資計画を皮切りに、今後さまざまなAI関連の取り組みが開始される見込みだ。
経営幹部は生成AIが企業の業務や役割に大きな影響を与える可能性があると考えているが、3分の2は生成AIを活用した全社改革を主導するために必要な技術の知識や変革に向けたリーダーシップを有していないと回答。一方の従業員は95%が生成AIの活用に価値を見出しているものの、同時に約60%が失業への不安やストレス、疲弊を感じていた。
YouTubeは、生成AIで作成し、実際の人物や場所、出来事と勘違いしやすいコンテンツについて、「改変または合成されたメディア」と視聴者に開示する仕組みを導入した。制作者ツールの「YouTube Creator Studio」に機能を追加し、「人物」、「映像」、「現実的な風景」を“生成“したコンテンツへのラベル付けを動画制作者に義務付ける。
シングルモーダルAIを超える推論が行えるマルチモーダルAIの活用は、膨大なデータへの迅速かつ網羅的なアプローチを可能とし、その結果、データ全体の最適化や新たな組み合わせによるイノベーションの創出性を広げることが期待されるとしている。
AIを使うという点では、Copilot for Microsoft 365が活用され、生成AIの評価や検証から、ビジネス実装へと進むことになる。また、AIを創るという点では、Microsoft Copilot StudioやAzure OpenAI Serviceにより、AIプラットフォームの整備から、独自AIを開発したり、より複雑なAIユースケースの実装に進んでいったりという動きがみられている」と指摘した。
ビジネスにおける生成AIの成熟度が高まってきていることを指摘し、どのように業務に活用するかを模索する準備段階から、AIを積極的に活用して業務効率化などを図っていく段階に移行したと語った。
イライザは、AI研究の第一人者である松尾豊・東大教授の研究室出身者が2018年に設立した。米メタが公開するLLMを基に、日本語性能に優れたLLMの開発に取り組んでいる。
具体的には、特定のキーワードと一緒に検索されているキーワードをマッピング形式で表示する「共起キーワード」機能での分析を生成AIがサポートする。検索キーワード同士のつながりの中から、一見してわかりづらい隠れた傾向を生成AIが考察し、テキスト形式で出力する。
ただし、常にGPT-4 Turboが使われるわけではない。パラキン氏によると、Copilotの設定で「より創造的に(Creative)」「より厳密に(Precise)」を選ぶとほぼ完全にGPT-4 Turboが使われるが、「よりバランスよく(Balanced)」では特定の場合にのみ使われるという。
損害をカバーする、法人向けの保険が誕生した。それが、あいおいニッセイ同和損害保険株式会社、株式会社Archaicが共同開発し、3月中に提供予定の「生成AI専用保険」だ。
月額20ドルで利用可能なMicrosoftの「Copilot Pro」は、「Microsoft 365」と統合されており、同スイートのさまざまなアプリにAI機能を提供する。「Excel」のユーザーは、Copilot Proを使用して、データのテーブルへの変換、数式の作成、データの分析、情報の並べ替えとフィルタリング、グラフの生成などを実行することができる。本記事では、Copilot Proをさまざまなタスクに活用する方法を紹介する。
市は2023年秋からNECと共同で生成AIの業務活用に向けた検証を進めてきた。今回の答弁の文案作成もその一環で、事前にAIに過去3年分の市議会の質問と答弁などを学習させたという。
生成AIへのプロンプト(指示)をノーコードで作成するプロンプトビルダーと、ユースケースに合わせて大規模言語モデル(LLM)や予測AIモデルを選択できるモデルビルダーの2機能を加え、8日から一般提供を始めた。
CopilotやCopilot in Windowsから利用できる画像生成機能が「Image Creator」(イメージクリエーター)だ。今回は同機能を使った画像生成の手順を解説する。1つ目がWindowsのデスクトップなどから呼び出して利用できる「Copilot in Windows」で使う方法、2つ目がブラウザの「Edge」から起動できる「Copilot」から利用する方法、3つ目がWebサイトとして公開されている「Image Creator」から利用する方法だ。
人がFigure 01に何が見えるかを尋ねると、Figure 01が目の前のテーブルに載っているものを自然な口調で説明する様子を紹介している。これは高度な自然言語処理能力、言語能力、視覚能力を示すものだ。
マイクロソフトが提供するAIアシスタント「Copilot」の無料版で、OpenAIの最新大規模言語モデル「GPT-4 Turbo」が使えるようになることがわかった。GPT-3.5ベースである「ChatGPT」の無料版と大きく差がついた形だ。
しかし、生成AIを使用したアプリケーションを開発したり、それらのツールを使って働いている人々の仕事に対する影響については、ほとんど議論されていないのが現状だ。生成AIは、選んだプログラミング言語で素早くコードを生成できるようになること以外に、どんな風に技術者の仕事を変えるのだろうか。
「人間レベルのAGIができることはかなり確かといえます。3年から8年以内にでしょうか。AGIが自身の心を省みることができた時、それは人間もしくは人間を超えたレベルの工学と科学ができることとなるでしょう」
現在、AI活用の取り組みの第1弾として、「Mate(メイト)」という社内向けのチャットボットをVertex AIで開発中であり、2024年に入りプロトタイプもリリースした。このチャットボットでは、人の業務を奪っていくのではなく、相談できる、一緒に成長する生成AIを目指しているという。Mateでは、対話形式で翻訳や要約、マニュアル検索を依頼でき、サムズアップ/ダウンで定性評価できる仕組みも実装する。プロンプトや会話フローを内包したAPIを公開して、各業務システムから呼び出せるようにしたり、ノーコードでプロンプトやAIモデルの評価・検証ができ仕組みも盛り込む予定だ。
ITパスポート試験の過去問を解かせることでIT分野の問題に対する正答率を調べた。また、ヤフー(現:LINEヤフー)と早稲田大学が2022年に開発した、日本語をどのくらい理解しているか評価するベンチマーク「JGLUE試験」を解かせて、一般常識をどの程度回答できるかも評価した。ELYZAのLLMが72.3%の精度を記録し、最も高い結果に。続いて、OpenAIのGPT-4(70.53%)とGPT-3.5(69.9%)で続いた。JGLUEの結果は、GPT-4が最も高くて95.42%を記録。次点にGPT-3.5(89.311%)が入り、rinnaのNekomata(81.68%)が続いた。
プロンプトから動画を生成するサービス「Pika」は3月10日、動画と連動したサウンドを生成する「Sound Effects(効果音)」機能を発表。有料版ユーザーに向けて公開されている。
Microsoftは、同社製のブラウザ「Edge」などにひもづいたAIアシスタント機能として「Microsoft Copilot」(以下、Copilot)を提供している。この機能は「ChatGPT」に近い感覚で利用できる上に、ChatGPTの有料プランで使える上位モデル「GPT-4」をベースにしており、さらにネット上の最新情報も結果に反映されるなど、ユーザーにとってメリットが多い。
例えば、入力した材料や好みに応じた料理レシピを提案する「料理クリエイター」などのプロンプトを公開している。プロンプトは「システム」と「ユーザー」の2つに分かれ、まず前者でAIに指示し、次に後者でユーザー個別の条件や要件を伝える仕組み。
「1つ目は、AIのスペシャリストとも呼べる人材であり、機械学習(ML)からニューラルネットワーク、大規模言語モデル(LLM)といった、AIに関して広範な訓練を積んでいる人たちがこれに相当する」と説明した。AI関連における2つ目の人材は、さまざまな業務や管理にまつわる役割とより密接に関わり合っているという。プロンプトエンジニアリングも、AI時代におけるホットで新たな仕事だ。
日本IBMでは、現在のIT業界が解決すべき課題として「工数依存からの脱却」「有識者依存からの脱却」「研鑽/業務余力の確保」の3点を挙げる。その解決のためにはエンドトゥエンドでのIT業務変革が必要であり、その実現によって新たな価値創造が実現すると考える。
「iPadで生成AIを使ったら便利かも?」と思ったら、すぐに試しましょう。以前から「ChatGPT(チャットジーピーティー)」はアプリで使えるようになっています。毎回ブラウザで開かなくて良いので、使い勝手も結構良いんです。ポイントを押さえて使いさえすれば、iPadでの作業能率をグッとUPしてくれるでしょう。
Claude 3は、結構雑なプロンプトでも「もしかしたら10の労力が7とか6くらいにはなるかも」というアウトプットが出てくる。その性能はSNSでも注目を浴びており「ようやく本物の“GPT-4超え”が出てきた」と話題だ。せっかくなので、記者歴7年の筆者から見た、Claude 3の文章力についてちょっと語ってみる。
性別や人種など異なる属性の人物を主人公にした物語の作成を指示すると、いずれのAIも「エンジニア」「教師」「医師」など社会的地位が高いとされる仕事を男性に与える傾向を示した。一方、「使用人」や「料理人」「売春婦」など社会の中で伝統的に低い地位に見られてきた職業を女性に与える傾向が強かった。メタのAIでは、女性は男性の4倍の頻度で家事労働者として描かれたという。
そもそもネット広告には、Yahoo! などのポータルサイトや新聞・雑誌などネットメディアの広告枠を指定して出す「純広告」と、複数のメディアにネット広告を一括で出してくれる「アドネットワーク」などの「運用型広告」があるが、現在は後者が主流になっている。ChatGPTなどの生成AIの技術によって、すでに広告制作プロセスの大半が自動化されていることが報じられている。これにより、バナー広告やリスティング(検索連動型)広告に代表されるネット広告において、商品・サービスの魅力や特長を端的で分かりやすい文章で表現するキャッチコピーを、大量に自動生成することが可能になっている。加えて、広告映像の編集作業の一部を担うようにもなってきている。
果たしてこの最新のテクノロジーは、今後、エンターテインメントやアートの世界に大きな変革をもたらすことになるのか。あるいは、現時点で注意すべき問題やリスクがあるとすれば、それはいったいどういうものなのか。『AIガバナンス入門 リスクマネジメントから社会設計まで』(ハヤカワ新書)の著者、弁護士で京都大学特任教授の羽深宏樹氏に、法律の専門家の立場から解説してもらった。
マッキンゼーの調査によると「最も影響を受ける分野が4つある」と言います。それは「カスタマーサービス」「マーケティングと営業」「ソフトウェア・エンジニアリング」それに「研究開発」の4つの分野です
生成AIの想定用途については、「知らない」と回答したのは企業は米国が1%前後だったのに対し、日本は3割を数えた。さらに米国企業は4割前後が「現在活用中」と答え、米国企業が先端技術を積極的に取り入れている実態が浮かび上がった。
Microsoft Copilotの特徴として、検索エンジンとの統合が挙げられる。GPT-4を核としながらも、「Prometheus」という基盤技術によって検索エンジンと連携する。つまり、ユーザーの質問を検索クエリとして読み解いて、AIが検索結果をまとめる機能が組み込まれている。
医療AIスタートアップのAIメディカルサービスが、胃カメラ検査(上部消化管内視鏡検査)中に、画像のAI解析によって早期胃がんの病変候補を検出して医師の診断補助を行う「内視鏡画像診断支援ソフトウェア gastroAI-model G」を発売した。厚生労働大臣からプログラム医療機器としての承認を受けた“AI医療機器”となる。
プロンプトとは、Copilotのような生成AIに投げかける質問のことだ。知りたいことや実行したいタスクを自然な言葉でCopilotにお願いできるということは間違いないのだが、どうすれば必要な答えを求める形で得られるのか、理解しておくと最終的な結果は異なってくる。
執筆時点では、テキストからモデルを生成する「Genie」と、動画や画像群からインタラクティブな3Dシーンを再生成できる「Interactive Scenes」が利用できます。トップページの下の2つの扉をクリックして移動できます。
プラグイン」はAIチャットをアプリに接続して、特定のトピックに関する回答を改善する機能で、レストランの検索・予約であれば「OpenTable」、食料品の注文・配達であれば「Instacart」(日本未提供)が利用できる。3月中には「Shopify」、「Klarna」、「Kayak」といったパートナーからも「Copilot in Windows」プラグインが追加される予定だ。
知っている具体的な生成AIサービスの名称も聞いている。「ChatGPT」が73.8%と圧倒的に高く、Microsoftの「Bing」が37.3%と続く。そのほかGoogleの「Bard」(現在は『Gemini』)、「AIチャットくん」なども25%強を集めたが、ChatGPTに比べると認知度は低く、ChatGPTが生成AIの代名詞のようになっているとしている。
米国の複数の有名大学が人工知能(AI)関連の職能開発コースを開講しており、プログラミング経験や開発経験はほぼ不要だとうたっている。例えば、ペンシルバニア大学の24週間にわたる集中講座は「プログラミング経験は一切不要」だとしており、マサチューセッツ工科大学(MIT)の12週間にわたる講座もノーコードソフトウェアによるAIソリューションの構築方法を学べるとしている。
OpenAIが2月15日に動画生成AI「Sora」を発表して世界中が大騒ぎになりましたよね(ニュース記事)。生成可能な動画は最長で60秒間。人物や空間の一貫性を保持しながら、物理法則を伴って動いているように見える。これまで動画生成AIでは不可能とされていたことがすべてできていて、常識がひっくり返されました。
SNS分析ツールを用いることで、過去の投稿のパフォーマンスを分析し、良い反応を得られたトピックや投稿スタイルを把握することもできます。これを参考にして、記事の設計を最適化することが大切だと思います。
プログラミングの勉強は一人だと環境構築が面倒だったり、わからないところを1人で調べるのが面倒だったりと挫折しやすいものです。でも心配することはありません。ChatGPTは、そんなあなたのための専属の家庭教師であり、最適な学習環境になるのです。AI時代のプログラミング教育にチャレンジしましょう!
東京の「百麺」(宮田朋幸店主)、埼玉の「中華そば四つ葉」(岩本和人店主)、千葉の「魂麺」(山西一成店主)といった人気実力店と、前橋のラーメン店「とりよしらーめん」(湯浅恒彦店主)「アンドレカンドレ」(藤沢克成店主)がタッグを組んで、AIと対話しながら前橋のご当地ラーメン作りに挑戦。AIから提案されたおよそ1000種類のレシピを店主たちが厳選し、試作を重ねて新たなご当地ラーメンを完成させました。
オープンAIのジェイソン・クォン最高戦略責任者は、同社がマイクロソフトの「事実上の子会社」だとマスク氏が示唆したことに反論し、同氏の主張は「現在当社に関与していないことへの後悔からきているのかもしれない」と指摘した。
訴状によると、マスク氏は2015年にオープンAIの設立を支援。その際、アルトマン氏は「人類のため」にAIを開発するオープンソースの非営利企業を設立するとマスク氏に説明した。マスク氏の弁護士は、マイクロソフトが出資するオープンAIが営利を追求しているのは契約違反だと主張している。
生成AI(人工知能)を搭載する動きはスマートフォンやパソコンだけでなく、ロボット分野でも本格化してきた。調達した資金はAIの学習に加え、ロボット製造や商用化の加速、人材採用の強化に使われる。生成AI「チャットGPT」を手掛けるオープンAIとは、生成AIの基盤モデルを人型ロボット向けに開発する。
簡単なブラウザアプリでも、プログラミングのコードをゼロから書くのは面倒ですし、プログラミングの知識がないと作り上げることはとても難しいです。ChatGPTにプログラミングのコードを書いてもらいファイルに書き出してもらえば、それをダウンロードしてブラウザで開くだけで使うことができます。自分の細かいニーズに対応した簡単なアプリケーションというのは
2022年後半頃より、生成AI、特にその代名詞といえるOpenAIのChatGPTをいかに使えばいいかという書籍や記事をあちこちで見かけるようになりました。我々グロービスでは、今後ホワイトカラーのビジネスパーソンが生成AIを活用することは当たり前のこととなり、それをうまく活用できる人と使いこなせない人の間での優勝劣敗が加速すると予測しています。
Copilotを利用するには、具体的に、デスクトップ下部に表示されるタスクバーから「Copilot」のアプリアイコンをクリックするか、「Windows」+「C」キーを同時に押下するなどしよう。デスクトップ画面の右端にCopilotを扱うためのサイドバー(サイドパネル)が表示される。このサイドバー下部にあるチャットボックスに「プロンプト」(指示や質問のテキスト)を入力すればよい。
生成AIに社をあげて注力するLINEヤフー。その大きな理由のひとつは生産年齢人口減少による労働力低下だ。2020年におよそ7500万人だった日本の生産年齢人口だが、2040年には6000万人まで減少すると予測されている。
「生成AIが登場して1年余り。特に『ChatGPT』が誰でも使えたことから、そのすごさを多くの人が体感し、大きな話題になった。これを企業の中でどう生かしていけるのかについてもこれまで試行錯誤を重ねてきたが、そろそろしっかりと業務に組み込んで効果を生み出していこうという段階に入ったのが、まさしく2024年だ」
ChatGPTは公開から3カ月ほどで、「MBA最終試験の解答がB(合格レベル)評価を獲得」「米司法試験の解答が上位10%のスコアを獲得」「日本の医師国家試験に合格」したほどの実力を持つ。あまりのスピードの速さに「生成AIスキルが陳腐化するのでは」と憂慮する声もある。では陳腐化しない生成AIスキルとは何か?
「Generative AI Summit Tokyo '24」 では、「触ってみる」 段階から、「生成 AI を活用したアプリケーションやソリューションを開発する」 段階に移行するためのヒントや、開発者、IT 企画、ビジネスまで広く利用できる生成 AI 関連の企業向けソリューションについて紹介する。また、デモブースも設けられ、Vertex AI Studio を使ったマルチモーダルのユースケースデモや、開発効率化支援のデモ、Gemini in Looker のデモも体験することが可能だ。
Soraの紹介ページには、イタリア・マルフィ海岸に建つ由緒ある教会の「ドローン映像」や、旧正月を祝う人々のパレード、雪景色の東京の街並みを映したトラッキングショットといった動画が紹介されています。これらはどれも、一度見ただけでは、誰の目にも本物にしか見えないでしょう。私などは、AIが生成したとわかっていても、いまだにそう思えないものもあるほどです。たとえ、作成されたアセットが歪んだりずれたりなど、AIによる不具合があったとしても、動画圧縮のせいに見えます。
子供とAIしまじろうが自由に会話を楽しむおしゃべり機能の他、「ごっこ遊び」「うた」「おはなし」といったあそび機能が用意されている。子供側から話しかけなくても、生活習慣を身に付けさせられるような言葉の投げかけや、年齢に合わせたテーマで話しかけるなど、子供の語彙(ごい)が自然に増えるような工夫を施しているという。英語によるやりとりにも対応しており、英語に触れる機会も増やせる。しまじろうとの会話で見えてきた子供の興味や感情を分析し、専用サイトで可視化できるレポート機能を提供する。子供の興味関心を知れることで、保護者と子供の時間を、より質の高いものへと変えられるとしている。
「Cotomo」は、ゆるーい雑談から悩み相談まで、身近な話し相手になる音声会話型おしゃべりAIアプリ。「App Store」から無料でダウンロード可能で、iOS 16.0以上のiPhoneで利用できます。Android版はまだ配信されておらず、公式サイトではアプリの開発状況を受け取るためのメールフォームが公開されています。
画像生成AIは魔法の道具ではありません。その仕組みに解明できていない部分はあっても、無から画像を生成するわけではないのです。今広まっている画像生成にも手法は幾つかありますが、大量の既存の画像を解析し、その表現が持つ何かしらの特徴を蓄積し、それを元に再表現を行うという点は共通しています。なおその解析等の処理は一般的に「学習」と呼ばれています。
Windows 11では、生成AIを活用したチャットbot型のアシスタント機能「Copilot」が導入され、特にOS標準の機能として使えるCopilotを「Copilot in Windows」と呼ぶ。このCopilot in Windowsのチャットでは、「会話のスタイルを選択」というメニューが表示され、具体的に3種類のスタイルを選択できるのが特徴だ。
生成AIへの投資をみると、日本企業の79%が24年に投資を予定する一方、投資済みと回答したのはわずか2%だった。投資済みと答えたのは韓国が33%、インドが28%、ASEAN諸国が11%だったの比べ大幅に低かった。
グーグルはGemmaを完全なオープンソースとして公開するのではなく「オープンモデル」と呼んでいる。「これは、モデルのウェイトや事前に訓練されたパラメータは利用できるが、実際のソースコードや訓練データは利用できないことを意味する」とグーグルの広報担当者のジェーン・パークは説明した。
《人間の頭は、決していい加減に忘れているのではない。自分にとって「意味のあるもの」と「意味のないもの」を区別し、意味のないものを忘れていく。ここに個性があらわれる。これはコンピューターには、できない機能である。/われわれは、この選択的忘却をフルに働かせることでコンピューターとわたり合える。》
「やがて仕事をする必要がなくなる日が来る。お望みとあらば仕事をすることも可能だがそれは自己満足のため。AIがすべてやりこなせるだろう」とマスク氏は語り、「人間にとってこれは良くも悪くもある。(仕事以外に)人生の意味を探し出すこと、これが将来の懸念になってくるだろう」とした。
Gmailでは、「提案を作って」「お礼のメールを」「バルセロナの旅行計画を書いて」などとGeminiに依頼すれば、すぐ生成される様子が披露された。クラウドで動作するものだが、現時点では英語のみサポート。今後、日本語を含む多言語対応が見込まれており、今回の展示は、未来をいち早く体験できる機会でもある。
東京大学大学院でAIを研究する松尾・岩澤研究室とビジョンを共有する企業・株式会社松尾研究所は2月26日、テックブログを開設した。ブログを通じ、知見の社会への還元、ブランディング、仲間づくりを目指すという。
Copilotを通じて、出席できなかった会議の議事録をもらい、その内容を2分程度で把握。それによって、情報収集の範囲を広げているという。また、参加した会議の日本語の記事録を英語に変換して、海外拠点に送るといった使い方のほか、会議の精度分析にも活用。受信したメールに関してもCopilotの指示により優先度が高いものから効率的に業務をこなしているという。また、顧客先を訪問する際には、競合状況を確認したり、最近のプレスリリースをまとめてもらったりといったことをCopilotに頼んでいるという。これにより、スタッフの資料作成の時間を削減したり、情報の鮮度向上にもつなげたりしているという。
アバナードは、コンサルティングファームのAccentureとMicrosoftの出資で誕生した企業だ。同年11月1日に提供が始まった「Copilot for Microsoft 365」についても、同時に6つのサービスを行うことを発表している。アバナード自身が2023年2月に始まったCopilot for Microsoft 365に関する広範なテストに参加しており、従業員はツールを使用して、6週間以内に1日当たり最大2時間の節約を実現したという。
同様の動画生成ツールはこれまでにもあったが、OpenAIのシステムは、膨大な労働力を削減する可能性を秘めた技術の急速な成長を象徴しており、エンターテインメント業界におけるAI活用がさらに促進されるとみられる。1月に発表されたハリウッドのリーダー300人を対象にした調査では、回答者の4分の3が、AIツールが自社の雇用の廃止・削減・統合に促すと回答したと報告されている。今後3年間で20万人近くのポジションが悪影響を受けると推定されている。
グーグルに対しては、GeminiのAI画像生成機能をめぐり、多様性を意識しすぎているとして激しい反発が起きている。歴史上の人物として生成された画像が、歴史的に不正確な人種や性別で描かれることが発覚し、誤解を招くと批判が殺到。同社は人物画像の生成機能を一時停止すると発表した。マスクはこうした動きを受け、「問題はGeminiだけでなく、グーグル検索にもある」とX(旧ツイッター)に投稿。グーグルはAI画像生成に関して「勇み足を踏んだ」との見方を示した。
「東京近郊を走る電車の窓に反射」と入力し生成された映像には、車窓に一瞬映る女性の様子が描写されています。映像のクオリティはこれまでよりも遥かに高く、時間も既存のAIは数十秒程度が多い中、1分間の動画が作れます。ただ、一方でよく見ると、看板の文字など所々に違和感も。オープンAIは「Sora」を芸術家や映像制作者に限定公開。リスクや安全性を今後検証していくとしています。
Copilotには、(1)Webサービス版、(2)アプリ版、(3)WebブラウザEdge上に組み込まれたもの、(4)OSに組み込まれた「Copilot in Windows(コパイロット イン ウィンドウズ)」、(5)「Microsoft 365」にひも付いた「Copilot for Micosoft 365」――など複数の形態があります。2024年1月には有料サービスの「Copilot Pro」も提供が開始されましたので、こちらも合わせて認識しておきましょう。
SNSへの投稿や米メディアによれば、ジェミニに「米国建国の父」の画像を生成するよう指示すると、黒人やアジア人など、非白人の見た目をした人物が描かれるという。SNS上では、グーグルが人種差別のリスクを過度に恐れ、歴史的事実と異なる画像を生成しているとして批判が集まっていた。
「AIは、画期的なイノベーションの核心となることが多い偶発的な発見や関係を、完全に体系化することはできません」と語る。「AIはイノベーションのための貴重なツールですが、人間の技能や創造力と組み合わせて、包括的なアプローチをとるべきです」。
米Googleは2月22日(現地時間)、マルチモーダルな生成AIツール「Gemini」で人物の画像を生成する機能を一時的に停止し、「一部の歴史的描写における不正確さ」を修正すると公式Xアカウントで発表した。
自動車が走るレーシングゲームのような映像ですが、場所や季節だけではなく年代に合わせたシチュエーションに変えられたり、近未来都市やゲーム『マインクラフト』のように世界感をガラっと変えることができるデモ。
具体的には、「生成AIの普及戦略で重視しているのは、市場にCopilotを浸透させるスピードである。有料版がいくつ売れたかといった指標だけで評価するのではなく、無料版のCopilotの利用者をいかに増やしていくかも重要な要素である。無料での利用が増えれば、有料版の利用を広げるベースになる。2024年2月のスーパーボールで放映したMicrosoftのCMでは、最後のメッセージで、iOSとAndroidのモバイルアップをダウンロードしてほしいと呼びかけている。PCだけでなく、スマホの無料利用者を増やすことも、事業拡大の基盤になる」と話す。
たとえば、新商品の取扱開始。本来であれば、見込み顧客、潜在顧客とコミュニケーションを図る絶好のチャンスです。しかし、忙しくて、商品を追加し、トップバナーの変更やお知らせ欄への追加で精一杯……という現場担当者は少なくないでしょう。「本当はいろいろやりたいのに……」。こんな悩みを解決するのが、文章生成系AI、つまり「ChatGPT」です。
Googleは2月8日、最上位に位置づけられる会話型生成AI『Genimi Advanced』を発表した。会話型生成AIの名称も「Bard」から「Gemini」へと変更されており、「Advanced」は有料にて利用可能だ。
相談者自身がベストアンサーとしてAIによる回答が最も役に立ったと選んだのは、全体の4.6%に過ぎなかった。一方で、別途行われた「恋愛相談においてそもそもAIの回答は有用なのか」を参考調査した簡易アンケートでは、82.1%のユーザーがAIの回答が有用だと評価したという。
研修・社内勉強会・資格取得などにより、生成AIについての知識・活用スキルを習得した社員は、社内GPTを活用して、メール文章作成、議事録作成・要約、英文の作成、企画のアイデア出しなどを行っている。そのほか、営業アポイントのテーマ検討、営業トークスクリプトの作成、ソースコードの分析・修正など、業務への活用を拡大しているという。
ChatGPTは登場以来、瞬く間に世界を席巻した。この大規模言語モデルは、わずか5日間で100万以上のユーザーを獲得したのだ。ユーザー数は爆発的に増えて現在は1億8000万人を超え、さらに増加中だ。ChatGPTの用途は無限で、コードの開発、履歴書の作成、さらには音楽の作曲まで行える。そして今、一部の人たちがキャリアアドバイスのためにChatGPTに頼るようになっている。
一般公開はまだだが、「Sora」に簡単なテキストを入力するだけで60秒の動画が生成できる。例えば、「スタイリッシュな女性が東京を歩いている」などと打ち込むと、東京のような街を女性が歩き、途中で顔がアップになるという構成面でもクオリティの高い、まるでCMのような動画が生成される。
名鉄とメイテツコムは、生成AI活用における技術検証のパートナーの1社に日立を選び、社内文書の有効活用による業務効率化に向けた検討を開始した。日立は、AIの業務適用実績やデータサイエンスの知見を生かし、導入に向けたコンサルティングからユースケースの検討、Microsoft Azure OpenAI Serviceを活用したセキュアな検証環境の構築、知識データベースの作成、導入効果の評価検証を支援した。
観光施設の料金を抑える手法として、ChatGPTは次のような提案をした。 「観光施設によっては、観光客がボランティアで臨時ガイドをすることができます。時間と知識を提供する代わりに、入場料が無料になったり、特別なサービスが受けられるかもしれません」このような手法がすぐさま問題を引き起こす可能性があることは容易に想像がつく。
OpenAIが提供するLLM「GPT-4」を活用し、広告の運用実績を自動で分析する。この分析機能により、広告の運用実績から数値的事実や因果関係を推察できるようにする。分析の速度と精度を高めることで、意思決定の質を上げるだけでなく、意思決定の量も拡大させる狙いがある。
ChatGPTを生んだオープンAIが開発中の、最新AI「Sora(ソラ)」。そのデモ映像が公開され、再現性の高さに驚きの声が上がっています。文章で指示することで、簡単に最長1分の映像を作れます。危険性も踏まえ、どう付き合うべきでしょうか?
米OpenAIが発表した動画生成AI「Sora」がX上で話題になっている。同社が2月15日(現地時間)に突如発表したもので、プロンプトで指示するだけで最長1分ほどの動画を作れるという。サンプルとして「ゲーム『Minecraft』を再現した動画」など複数の映像を公開しており、そのクオリティーの高さにXでは驚きの声が相次いでいる。
Soraは入力したテキストから最長60秒の動画を生成。詳細な場面や複雑なカメラの動きなども表現できるとしています。OpenAIはサンプルとして、「雪が積もった美しい東京の街がにぎわっている。カメラは、雪景色を楽しんだり、近くの店で買い物する人たちを追いながら通りを抜けていく。美しい桜の花びらが風に乗って雪片とともに飛んでいる」というテキストから生成した動画を公開しています。
今のソフトウェア開発者は積極的にAIツールを使っており、同時にAIシステムを構築する立場になることも多い。Stack Overflowが数カ月前に開発者9万人を対象として実施した調査では、回答者の70%が開発プロセスでAIツールをすでに使用しているか、今後使用する予定であることが明らかになった。
販売実績や気象情報などをもとに商品発注数をAIで予測するサービス。3週間先までの各商品発注数量を算出し、異常値を確認することで発注の精度を向上させるほか、AIによる精度の高い発注で廃棄ロスの削減、AI導入による人手不足の解消などの効果を発揮する。
YouTubeでは、何年も前にYouTube を立ち上げたときと同じ使命、つまりクリエイターの創作活動を支援するという目的からAIの進歩に取り組んでいるとし、「AIは人間の創造性に取って代わるものではなく、人間の創造性をサポートするものであるべき」と強調している。
NHKニュースで「AIアナウンス」が活用されている。AI(人工知能)による音声だが、テンポも声の高低も耳に心地よい。もちろん正確で、読み間違えはない。いつか人間のアナウンサーに代わる日が来るだろうか。
「執筆中もずっとChatGPTに取材しながら書いていました。例えば、『こういった人物が小説の中に出てきたら、読者はどう感じますか?』『この文体は、どう思いますか?』と。会見で咄嗟に5%と言ったのは、私の中では5%ぐらいという感覚は、やっぱりあったんですよね」(九段さん)
米グーグルは8日、同社の対話型AI(人工知能)「Bard(バード)」の名称を「Gemini(ジェミニ)」に切り替えると発表した。スマートフォンの基本ソフト(OS)の「アンドロイド」向けには専用のアプリも公開する予定で、AI機能を強化することで検索などの利便性を拡充させる。
「北九州マラソン」でのあいさつ文を作成するデモンストレーションもあり、1分ほどで「沿道の応援、ランナーの熱い思い、それぞれのストーリーに触れながら、北九州の魅力を再発見していただければ幸いです」といった文章が出来上がった。
テキストファイルの内容をすばやく理解するのに役立つ新機能が追加された。選択テキストの右クリックメニューから[Copilot で説明する](Explain with Copilot)コマンドを選択すると、当該テキストを「Copilot in Windows」へ送り、解説を依頼することができる。
生成型の人工知能(AI)によって、人間が実際に撮影したかのようなリアルな画像が作成可能になり、何が本物で何がAIで生成したものかが判別しにくくなっている。Metaはこの状況を受け、偽情報に対抗するために、AI生成画像に関するいくつかの取り組みを発表した。
「瞳のAIチェック」は、スマートフォンで瞳の写真を撮るだけで角膜と涙の状態をスコア化し、トータルスコアを5段階で表示。その後、「目薬検索」で自身が悩んでいる症状や清涼感の好み、コンタクトの有無などの使用シーンなどを画面に表示される項目にしたがってチェックを入れることで、ニーズに合わせてスマイルブランドの目薬が提案される。
気に入ったものを購入できるライブコマース市場は拡大し、化粧品・コスメやアパレル、インテリアなど、さまざまなカテゴリーで実施されている。しかし、ライブ配信はパーソナリティーの選定やスケジュール調整が難しいことに加え、カメラやマイクといった設備に高いコストがかかるといった課題があるという。
Microsoftは、生成AIを活用したアシスタント機能「Copilot」を展開している。特に、Windows 11のOS標準機能として使えるCopilotを「Copilot in Windows」と呼ぶ。このCopilot in Windowsでは、ChatGPTのように入力したテキストに対して出力を返してくれる──というのが基本の使い方となるが、テキスト入力以外の使い方もいくつかのバリエーションがある。音声入力を使ってラクをする、画像を入力して内容を尋ねるなどがある。
Metaでは、「人間と人工的なコンテンツの違いが曖昧になっている」とし、人々が見ているフォトリアリスティックなコンテンツがAIを使って作成されたものと知る手助けとして、ラベル対応を推進。今後数カ月のうちに、InstagramやFacebookなどのアプリがサポートする全言語でラベルの適用を開始する。
Tech Mahindraのエンタープライズテクノロジー担当プレジデントHarshul Asnani氏は、日常的な仕事にAIや機械学習が使われるようになったことで、「一部のIT関係のスキルはパラダイムシフトに直面している」と述べている。これには、これまで人間によって処理されていた反復的かつルールに従って行うあらゆる作業が含まれており、「簡単なデータ入力作業、標準的なアプリケーションの定型的なコーディングに加え、初歩的なデータ分析の一部でさえ、AIアルゴリズムによって自動化されつつある」とAsnani氏は言う。
AIタレントやAIモデルは、AI技術で生成した各ブランドの専属モデルで、ブランディングやプロモーションの最適化、ECサイトや店頭でのインタラクティブなショッピング体験や、顧客に合わせた無数のスタイリング提案、モデル撮影やささげ撮影におけるコスト削減とリードタイム短縮を実現するサービス。
目的の場所を言うと、LLMが2.5億以上の場所に関する詳細情報とコミュニティからの投稿をもとに、「どこに行くべきか」を提案してくれる。例えば、「サンフランシスコで、ヴィンテージの雰囲気が漂う場所」と入力すると、おすすめのスポットをマップ上で紹介し、写真や投稿などを確認できる。
GPTは、OpenAIによって開発された大規模言語モデルファミリーであり、深層学習を使用して、人間が話しているような会話のテキストを生成する。OpenAIのChatGPTの標準版は、「GPT-3.5」を利用してチャットボットを実現している。しかし、「ChatGPT Plus」では、OpenAIの言語モデルシステムのより高度なバージョンである「GPT-4」が使われている。OpenAI以外の企業が開発したほかのチャットボットでも、GPT LLMは使用されている。GPT-4を利用する「Microsoft Copilot」もその1つだ。
AIやChatGPTのことはよく分からないと思っている人でも、まず話しかけてみる。答えが返ってきたらそのまま信じるのではなくて、その答えについてさらに質問を重ねる、ということをやってみるんです。何か1つ聞いて答えが出てきたら、この部分の典拠(てんきょ) は何ですか、と問いただす。このやりとりを続けていくと、そのうち「すみません、分かりません」とか「間違えました」ってChatGPTが謝るんですよ。出された答えを鵜呑みにするんじゃなくて、この過程を経ることが大事なのかなと。
今回追加された画像生成機能は「Imagen 2」モデルを搭載しており、Googleによると「写実的なアウトプットが得意」とのこと。現時点では画像生成のためには英語でプロンプトを入力する必要がある。
この生成AI機能は、2億5000万件以上の場所に関する情報と3億人以上の投稿者からのレビューを分析して提案を生成できる大規模言語モデル(LLM)を搭載している。
「OpenAIやGoogleの提供している強力なLLMは、テキストだけでなく画像や動画に対応するマルチモーダル化を進めている。音楽を作曲する生成AIもすでに実現している。生成AI全般のトレンドとして、24年には動画生成がより一般的になるのではないか」
「文化庁による素案を基にすると、生成AIによる著作物は創作過程がわからないかぎり、著作権が発生するかどうかが判断できない。また、生成AIによる創作物が、自身がまったく認識していなかった著作物の著作権を侵害してしまう場合がある」などと指摘した。
制作したアニメ映像は、ある老人と花を巡るストーリーを描いており、動画尺は約8分30秒。映像の脚本部分はAIチャット「ChatGPT」(GPT-3.5)を使って制作し、それを元にキャラクターデザインや背景、コンセプトアートなどを画像生成AI「Midjourney」で作った。映像の絵コンテや登場キャラクターのアニメーション制作、背景の加筆などは人力で行ったという。
あんぱんでおなじみの木村屋總本店(以下 木村屋)とNECがコラボした「恋AIパン」が話題になっています。なんと実際に“恋の味”をAI(人工知能)用いて食品化したもの。