Microsoft Copilot版SunoのV3化を記念して、書籍向けに執筆していたCopilot版Sunoの操作マニュアルを公開します。
Amazonが、レジなし店舗向け決済技術「Just Walk Out」の廃止を進めていることが報じられています。食料品店担当上級副社長のTony Hoggett氏がJust Walk Outの廃止について発言。
Windows 11の一部ユーザーが、標準アプリ「フォト(Photos)」に生成AI機能のCopilotが利用できるようになったと報告しています。
OpenAIは4月1日(現地時間)、チャットAI「ChatGPT」をサインアップ不要で利用可能になると発表しました。「AIの機能に興味のあるすべての人がAIにアクセスできるようにすることを目的として、段階的に展開しています」とのことです。
OpenAIは15秒ほどの短い音声を元に、本人そっくりで、感情を込めたリアルな音声を生成できるAIモデル「Voice Engine」を発表しました。元音声と生成音声のサンプルがいくつか公開されています。
音楽配信をするときには、必須ではないのですが、歌詞データを用意しておくと、配信サービスが用意した歌詞表示機能が使えるようになります。Apple MusicとSpotifyにはデバイス側で使えるボーカルオフ機能があるので、手軽にカラオケができるというわけです。簡単にできると思ったのですが……。
生成AIに関する重要論文5本を解説する連載。今週は、生成AIの回答を自動でGoogle検索し事実か確認するAI「SAFE」、自律型AIをコントロールするためのOS「AIOS」など。
出荷間近となったAIデバイス「Ai Pin」。日本ではソフトバンクが取り扱うことが発表され、注目を浴びています。いち早く米国で購入した著者が、購入前の各種手続きについて解説します。
マイクロソフトが、まもなくクラウドでなく、PCのローカル環境で実行できるCopilot AIをリリースする模様です。これは、台北で開催されたイベント「Intel AI Summit」における質疑応答でインテル幹部が述べたとのことです。
ComfyUIでControlNet(Canny/Depth/OpenPose)を使うには
大規模言語モデル(LLM)でコンセプトを考えて、AI作曲サービスでボーカル入り楽曲を作り出す。そんなやり方で制作したコンセプトアルバムを音楽配信に載せるという話を、自ら音楽レーベルを主宰し、テクノロジー関連の執筆もこなしている山崎潤一郎さんに、数回にわたって執筆いただきます。
Adobeは春と秋に大きなイベントを開催する。秋は「Adobe MAX」。Adobeと言われて多くの人が思い出す、Photoshopなどのクリエイティブ・ツールのイベントだ。では春は? それが「Adobe Summit」。同社のもう1つの柱である、デジタルマーケティング関係のイベントだ。今年も同社の協力で、米・ラスベガスに取材に来ている。
Googleは次回の新機能追加アップデートPixel Feature Dropにて、Pixel 8にも「Gemini Nano」を提供すると発表しました。開発者向けオプションとしての形となります。
4月13日より、アジア有数のイノベーション&テクノロジー展示会『InnoEX』、世界の最新エレクトロニクス製品が一同に会する『香港エレクトロニクス・フェア(春)』が始まります。
GitHubは、脆弱性のあるコードをAIボットが自動的に発見、修正したコードとその解説をプルリクエストしてくれる「code scanning autofix」(コードスキャン自動修正機能)を発表しました。
X(Twitter)のPremiumユーザーは今週、オーナーのイーロン・マスク氏が設立したAI企業xAIのチャットボット「Grok」を使えるようになります。
既存のカテゴリーの曲を巧みに作り上げるSuno V3。では、これまでにないような音楽をAIは作ることができるのでしょうか?
Stablity AIが、独自の3D生成サービスを提供してきたTripo AIと共同開発した「TripoSR」を紹介します。
Suno V3を使って好みの曲を作っていくためのワークフローを確立した感じがするので、その一例をお見せしようと思います。
先週発表された生成AI分野で重要な論文の中から5本を解説します。動画生成AI「Sora」のオープンソース版「Open-Sora 1.0」、AI同士を掛け合わせて高品質なAIを自律的に生み出す手法など。
ComfyUI使ってみたいけど…。
YouTubeは3月19日、生成AIを使用したものを含め、改変または合成されたコンテンツに関しては、視聴者にそれとわかるようにラベル付けを行えるツールをYouTube Creator Studioに導入すると発表しました。
Suno V3が正式に公開されました。
無料で使えるスマホ用3Dスキャンアプリ Scaniverse が、最新技術『3Dガウシアンススプラッティング』に対応しました。
YouTubeは3月21日、「YouTube Music AI インキュベーター」を日本でも開始したと発表しました。YouTube Music AI インキュベーターは、アーティストや作詞・作曲家、プロデューサーなど、音楽における生成AIのYouTubeの取り組みに対して、意見を募るというプログラムです。
3月23日に公開予定のSuno V3。すでにAlpha版でたっぷり遊んでいる自分としては、一般公開時に皆さんがスタートダッシュできるように、改めて使い方をまとめておこうと思います。
マイクロソフトは、DeepMindの共同創業者ムスタファ・スレイマン氏が、自身の会社Inflection AIを離れ、新部門であるMicrosoft AIのエグゼクティブ・バイス・プレジデント兼CEOに就任することを発表しました。
Stable Diffusionを提供するStability AIは、高品質なマルチビュー推定と3Dメッシュの生成を行う新たなモデル「Stable Video 3D」(SV3D)を発表しました。ただし現時点で公開されているのは、画像から多角度の姿を推定するマルチビュー推定部分のみです。現状ではまだその全貌がよく知られていないので、ローカルで試せるようになる前に、その概要と技術的な構成についてまとめました。
マイクロソフトは5月20日(米現地時間)、「ハードウェアとソフトウェアにまたがるAIビジョン」に関する特別イベントを開催する模様です。複数の大手メディアに、同社のサティア・ナデラCEOが上記のテーマについて話すと予告したとのこと。
アップルは、「今年iPhoneソフトウェアに搭載されるいくつかの新機能を強化」する目的のため、GoogleとGemini AIの使用に関する協議に入っている模様です。
英Nothing Technologyは、Nothing Phone (2a) の予約購入者向けに、対話型AIサブスクリプション「Perplexity Pro」1年分の無料アクセスコードを提供すると発表しました。19日までに購入したユーザーを対象とするため、猶予はわずかです。コードの使用期限は4月30日まで。
Appleは、高性能なMLLMを探るべく、モデルの構造や学習に使うデータの選び方がモデルの性能にどのように影響するかなどを詳しく分析した論文を公開しました。
AIスタートアップのCognitionが自律型のAIソフトウェアエンジニア「Devin」を発表した。Devinは人間と同様にコードエディタやコンソール、Webブラウザを用いて情報を参照し、コーディングやデバッグ作業を自律的に行える能力を持つようだ。
Google DeepMindは、自然言語の指示に従ってゲーム内でタスクを実行するAIエージェント「Scalable Instructable Multiworld Agent(SIMA)」を発表しました。
DeepMindではゲームの世界を「現実の世界同様、常に変化する目標を備えた豊かな学習環境」と捉えており、様々なルールがあるゲームの中でゲームプレイを学習することによって、幅広い環境で役立つ「AIエージェント」の開発に役立つとしています。
人気連載「生成AIグラビアをグラビアカメラマンが作るとどうなる?」の著者である西川和久さんを講師に迎えたオンラインワークショップ「生成AIグラビア実践ワークショップ」過去回アーカイブの販売を開始しました。
NVIDIA CEOのJensen Huang氏はAIの進化で人間の言葉がプログラミング言語となり、プログラミング教育は重要ではなくなったとし、プログラミングやコンピュータサイエンス教育を重視する一般的な意見とは反対の立場を表明した。
画像生成AIサービスMidjourneyは、複数の生成画像で一貫性を持った人物画像の生成に対応する「Character Reference」機能のテストを開始しました。
アップルが長らく完全自動運転のEV(電気自動車)を開発してきたことは、米カリフォルニア州のDMV(車両管理局)が同社の公道テストを公表しており、複数の大手メディアが動静を細かく伝えてきた経緯から、公然の事実です。
生成AIをゲーム開発の現場で活用している筆者が、ゲーム内テキストの作成、中でもいわゆるRPGの村人たちのセリフの生成を一から行う流れを解説します。第2回は、データを大量に作るところから改善すべき点まで。
Activision Blizzardの元CEO、ボビー・コティック氏が、OpenAI CEOサム・アルトマン氏を含む潜在的なパートナーのグループに対しTikTok買収のアイデアを提案したと、Wall Streeet Journal紙が報じています。
民生用GPUはNVIDIA RTX 4090の24GBメモリが最大ですが、これでLLMのファインチューニングは困難とされています。それを可能にするという技術が発表されました。
人気連載「生成AIグラビアをグラビアカメラマンが作るとどうなる?」の著者である西川和久さんを講師に迎えた、生成AIグラビアワークショップの第6回を3月22日に開催いたします。なお、今回お申し込みいただいた方は、第5回分の動画アーカイブを視聴いただけます。