AI

AI作曲サービスの新星「Udio」が誰でも利用可能に。Sunoを超えたか、試してみた(CloseBox) 画像
テクノロジー

AI作曲サービスの新星「Udio」が誰でも利用可能に。Sunoを超えたか、試してみた(CloseBox)

Suno対抗のAI作曲サービスとして前評判の高かったUdioがパブリックベータとして一般公開されました。

Google、AI動画制作ツール『Google Vids』発表。原稿・絵コンテ・動画編集とAIナレーションまでワンストップの新しいWorkspaceアプリ 画像
テクノロジー

Google、AI動画制作ツール『Google Vids』発表。原稿・絵コンテ・動画編集とAIナレーションまでワンストップの新しいWorkspaceアプリ

Google Cloud Next 2024イベントを前に、Googleが新しいWorkspaceアプリ『Google Vids』を発表しました。

「Suno超えた?」と噂の、リアルな歌声でAI作曲して音源分離もできる「Sonauto」を試してみた(CloseBox) 画像
テクノロジー

「Suno超えた?」と噂の、リアルな歌声でAI作曲して音源分離もできる「Sonauto」を試してみた(CloseBox)

AIスタートアップのSonautoが運営する同名のAI作曲サービス「Sonauto」がSunoを超えた?と評判です。

第三回AIアートグランプリ開催決定。絵画部門を新設 画像
テクノロジー

第三回AIアートグランプリ開催決定。絵画部門を新設

AIアート作品コンテスト「AIアートグランプリ」の3回目開催が決まりました。第一回は2023年3月、第二回は同年11月に結果発表が行われましたが、第三回は、2024年8月から作品のエントリーを受け付け、最終審査は11月となります。

GPT-4超え精度でスマホ上実行できるオンデバイス生成AI「Octopus v2」、Google「生成AIは大きければいいってものではない」など重要論文5本を解説(生成AIウィークリー) 画像
テクノロジー

GPT-4超え精度でスマホ上実行できるオンデバイス生成AI「Octopus v2」、Google「生成AIは大きければいいってものではない」など重要論文5本を解説(生成AIウィークリー)

生成AIの重要論文5本を解説する連載。今回は、GPT-4越えで直接スマホ上で処理できるオンデバイス生成AI「Octopus v2」などを取り上げます。 

Microsoft CopilotがSuno V3に対応。チャットAIで超お手軽に作曲する最新操作マニュアル(CloseBox) 画像
テクノロジー

Microsoft CopilotがSuno V3に対応。チャットAIで超お手軽に作曲する最新操作マニュアル(CloseBox)

Microsoft Copilot版SunoのV3化を記念して、書籍向けに執筆していたCopilot版Sunoの操作マニュアルを公開します。

国内版Galaxy S24 / S24 Ultra実機ハンズオン。Galaxy AIの日本語文字起こし精度が海外版より向上、手書き文字認識も優秀(石野純也) 画像
ガジェット

国内版Galaxy S24 / S24 Ultra実機ハンズオン。Galaxy AIの日本語文字起こし精度が海外版より向上、手書き文字認識も優秀(石野純也)

4月11日に、日本版の「Galaxy S24」「Galaxy S24 Ultra」が発売されます。同シリーズは、グーグルの「Gemini」をAIモデルに採用した「Galaxy AI」が最大の特長。Galaxy AIの中でも、筆者が特に注目しているのはボイスレコーダーの文字起こし機能です。

Windows 11の「フォト」にCopilot AI機能が追加、デスクトップ背景の設定やスライドショー作成が可能に。一部ユーザーのみ展開中 画像
ガジェット

Windows 11の「フォト」にCopilot AI機能が追加、デスクトップ背景の設定やスライドショー作成が可能に。一部ユーザーのみ展開中

Windows 11の一部ユーザーが、標準アプリ「フォト(Photos)」に生成AI機能のCopilotが利用できるようになったと報告しています。

ChatGPTがOpenAIアカウントなしでも利用可能に。段階的に展開 画像
テクノロジー

ChatGPTがOpenAIアカウントなしでも利用可能に。段階的に展開

OpenAIは4月1日(現地時間)、チャットAI「ChatGPT」をサインアップ不要で利用可能になると発表しました。「AIの機能に興味のあるすべての人がAIにアクセスできるようにすることを目的として、段階的に展開しています」とのことです。

OpenAIのAI音声技術「Voice Engine」、アバターサービスのHeyGenが採用 画像
テクノロジー

OpenAIのAI音声技術「Voice Engine」、アバターサービスのHeyGenが採用

OpenAIは15秒ほどの短い音声を元に、本人そっくりで、感情を込めたリアルな音声を生成できるAIモデル「Voice Engine」を発表しました。元音声と生成音声のサンプルがいくつか公開されています。

AI歌手はわりとテキトーに歌う。Suno AIの中に住むバーチャルシンガーの人間らしさ(CloseBox) 画像
テクノロジー

AI歌手はわりとテキトーに歌う。Suno AIの中に住むバーチャルシンガーの人間らしさ(CloseBox)

音楽配信をするときには、必須ではないのですが、歌詞データを用意しておくと、配信サービスが用意した歌詞表示機能が使えるようになります。Apple MusicとSpotifyにはデバイス側で使えるボーカルオフ機能があるので、手軽にカラオケができるというわけです。簡単にできると思ったのですが……。

生成AIの回答を自動でGoogle検索し事実か確認するAI「SAFE」、自律型AIをコントロールするためのOS「AIOS」など重要論文5本を解説(生成AIウィークリー) 画像
テクノロジー

生成AIの回答を自動でGoogle検索し事実か確認するAI「SAFE」、自律型AIをコントロールするためのOS「AIOS」など重要論文5本を解説(生成AIウィークリー)

生成AIに関する重要論文5本を解説する連載。今週は、生成AIの回答を自動でGoogle検索し事実か確認するAI「SAFE」、自律型AIをコントロールするためのOS「AIOS」など。

いよいよ出荷が始まる手のひらAIデバイス「Humane Ai Pin」のやっておくことリスト 画像
テクノロジー

いよいよ出荷が始まる手のひらAIデバイス「Humane Ai Pin」のやっておくことリスト

出荷間近となったAIデバイス「Ai Pin」。日本ではソフトバンクが取り扱うことが発表され、注目を浴びています。いち早く米国で購入した著者が、購入前の各種手続きについて解説します。

インテル、マイクロソフトのCopilot AIはPCローカルで実行可能になると述べる。次世代NPU搭載プロセッサが前提 画像
テクノロジー

インテル、マイクロソフトのCopilot AIはPCローカルで実行可能になると述べる。次世代NPU搭載プロセッサが前提

マイクロソフトが、まもなくクラウドでなく、PCのローカル環境で実行できるCopilot AIをリリースする模様です。これは、台北で開催されたイベント「Intel AI Summit」における質疑応答でインテル幹部が述べたとのことです。

生成AIグラビアをグラビアカメラマンが作るとどうなる?第21回:ComfyUI応用編。ControlNetでポーズ・構図を指定する (西川和久) 画像
テクノロジー

生成AIグラビアをグラビアカメラマンが作るとどうなる?第21回:ComfyUI応用編。ControlNetでポーズ・構図を指定する (西川和久)

ComfyUIでControlNet(Canny/Depth/OpenPose)を使うには

新連載「AIだけで作った曲を音楽配信する」。生成AIが作り上げた架空バンド「The Midnight Odyssey」を世界デビューさせる、その裏側 画像
テクノロジー

新連載「AIだけで作った曲を音楽配信する」。生成AIが作り上げた架空バンド「The Midnight Odyssey」を世界デビューさせる、その裏側

大規模言語モデル(LLM)でコンセプトを考えて、AI作曲サービスでボーカル入り楽曲を作り出す。そんなやり方で制作したコンセプトアルバムを音楽配信に載せるという話を、自ら音楽レーベルを主宰し、テクノロジー関連の執筆もこなしている山崎潤一郎さんに、数回にわたって執筆いただきます。

Adobeの生成AI技術を先取り公開 Adobe Summit 2024「Sneaks」のマーケティングツールを一挙解説(西田宗千佳) 画像
テクノロジー

Adobeの生成AI技術を先取り公開 Adobe Summit 2024「Sneaks」のマーケティングツールを一挙解説(西田宗千佳)

Adobeは春と秋に大きなイベントを開催する。秋は「Adobe MAX」。Adobeと言われて多くの人が思い出す、Photoshopなどのクリエイティブ・ツールのイベントだ。では春は? それが「Adobe Summit」。同社のもう1つの柱である、デジタルマーケティング関係のイベントだ。今年も同社の協力で、米・ラスベガスに取材に来ている。

Google Pixel 8もオンデバイスAI Gemini Nano対応へ「ハードウェア的に動作不能」は撤回 画像
テクノロジー

Google Pixel 8もオンデバイスAI Gemini Nano対応へ「ハードウェア的に動作不能」は撤回

Googleは次回の新機能追加アップデートPixel Feature Dropにて、Pixel 8にも「Gemini Nano」を提供すると発表しました。開発者向けオプションとしての形となります。

アジア有数のI&T展示会『InnoEX』『香港エレクトロニクス・フェア』4月13日開幕 最先端技術と次世代スマート・ソリューション集結、巨大なアジア市場の玄関口 画像
テクノロジー

アジア有数のI&T展示会『InnoEX』『香港エレクトロニクス・フェア』4月13日開幕 最先端技術と次世代スマート・ソリューション集結、巨大なアジア市場の玄関口PR

4月13日より、アジア有数のイノベーション&テクノロジー展示会『InnoEX』、世界の最新エレクトロニクス製品が一同に会する『香港エレクトロニクス・フェア(春)』が始まります。

コードの脆弱性をAIが自動で発見、解説と修正提案する機能をGitHubが発表。JavaScript、TypeScript、Java、Python対応 画像
テクノロジー

コードの脆弱性をAIが自動で発見、解説と修正提案する機能をGitHubが発表。JavaScript、TypeScript、Java、Python対応

GitHubは、脆弱性のあるコードをAIボットが自動的に発見、修正したコードとその解説をプルリクエストしてくれる「code scanning autofix」(コードスキャン自動修正機能)を発表しました。

AIは人類が体験したことのない新しい音楽ジャンルを作れるか? Claude 3 OpusとSuno V3に問うた結果(CloseBox) 画像
テクノロジー

AIは人類が体験したことのない新しい音楽ジャンルを作れるか? Claude 3 OpusとSuno V3に問うた結果(CloseBox)

既存のカテゴリーの曲を巧みに作り上げるSuno V3。では、これまでにないような音楽をAIは作ることができるのでしょうか?

生成AIで3D化して整形。ローカルでも超高速で3Dデータ生成できる「TripoSR」を試す 画像
テクノロジー

生成AIで3D化して整形。ローカルでも超高速で3Dデータ生成できる「TripoSR」を試す

Stablity AIが、独自の3D生成サービスを提供してきたTripo AIと共同開発した「TripoSR」を紹介します。

Suno AIに好みの曲を作らせて自分で歌う、オリジナル曲AIロンダリングで名曲を生み出すワークフロー(CloseBox) 画像
テクノロジー

Suno AIに好みの曲を作らせて自分で歌う、オリジナル曲AIロンダリングで名曲を生み出すワークフロー(CloseBox)

Suno V3を使って好みの曲を作っていくためのワークフローを確立した感じがするので、その一例をお見せしようと思います。

動画生成AI「Sora」のオープンソース版「Open-Sora 1.0」公開、AI同士を掛け合わせて高品質なAIを自律的に生み出す手法など重要論文5本を解説(生成AIウィークリー) 画像
テクノロジー

動画生成AI「Sora」のオープンソース版「Open-Sora 1.0」公開、AI同士を掛け合わせて高品質なAIを自律的に生み出す手法など重要論文5本を解説(生成AIウィークリー)

先週発表された生成AI分野で重要な論文の中から5本を解説します。動画生成AI「Sora」のオープンソース版「Open-Sora 1.0」、AI同士を掛け合わせて高品質なAIを自律的に生み出す手法など。

生成AIグラビアをグラビアカメラマンが作るとどうなる?第20回:MシリーズMacでもComfyUI+フロントUIが動く!ComflowySpaceの使い方(西川和久) 画像
テクノロジー

生成AIグラビアをグラビアカメラマンが作るとどうなる?第20回:MシリーズMacでもComfyUI+フロントUIが動く!ComflowySpaceの使い方(西川和久)

ComfyUI使ってみたいけど…。

YouTube、生成AIフェイクなど合成・改変コンテンツはラベルで明示を求める。明らかな非現実や補正等は対象外 画像
テクノロジー

YouTube、生成AIフェイクなど合成・改変コンテンツはラベルで明示を求める。明らかな非現実や補正等は対象外

YouTubeは3月19日、生成AIを使用したものを含め、改変または合成されたコンテンツに関しては、視聴者にそれとわかるようにラベル付けを行えるツールをYouTube Creator Studioに導入すると発表しました。

AI作曲サービス「Suno」、無料ユーザーにも高品質版V3を開放。1日20曲、1曲2分が生成可能(CloseBox) 画像
テクノロジー

AI作曲サービス「Suno」、無料ユーザーにも高品質版V3を開放。1日20曲、1曲2分が生成可能(CloseBox)

Suno V3が正式に公開されました。

YouTube Music AIインキュベーターが日本でも開始 初音ミクのクリプトンと協力 画像
テクノロジー

YouTube Music AIインキュベーターが日本でも開始 初音ミクのクリプトンと協力

YouTubeは3月21日、「YouTube Music AI インキュベーター」を日本でも開始したと発表しました。YouTube Music AI インキュベーターは、アーティストや作詞・作曲家、プロデューサーなど、音楽における生成AIのYouTubeの取り組みに対して、意見を募るというプログラムです。

リアルな歌唱もインストも作曲できる生成AI「Suno」高性能な最新版V3が3月23日から無料?→22日公開されました。最新の使い方を解説(CloseBox) 画像
テクノロジー

リアルな歌唱もインストも作曲できる生成AI「Suno」高性能な最新版V3が3月23日から無料?→22日公開されました。最新の使い方を解説(CloseBox)

3月23日に公開予定のSuno V3。すでにAlpha版でたっぷり遊んでいる自分としては、一般公開時に皆さんがスタートダッシュできるように、改めて使い方をまとめておこうと思います。

マイクロソフト、AI部門CEOにDeepMind共同創業者のムスタファ・スレイマン氏が就任 画像
テクノロジー

マイクロソフト、AI部門CEOにDeepMind共同創業者のムスタファ・スレイマン氏が就任

マイクロソフトは、DeepMindの共同創業者ムスタファ・スレイマン氏が、自身の会社Inflection AIを離れ、新部門であるMicrosoft AIのエグゼクティブ・バイス・プレジデント兼CEOに就任することを発表しました。

期待の3D生成AI「Stable Video 3D」(SV3D)発表。動画から3Dモデル生成、現状できることと今後の展望 画像
テクノロジー

期待の3D生成AI「Stable Video 3D」(SV3D)発表。動画から3Dモデル生成、現状できることと今後の展望

Stable Diffusionを提供するStability AIは、高品質なマルチビュー推定と3Dメッシュの生成を行う新たなモデル「Stable Video 3D」(SV3D)を発表しました。ただし現時点で公開されているのは、画像から多角度の姿を推定するマルチビュー推定部分のみです。現状ではまだその全貌がよく知られていないので、ローカルで試せるようになる前に、その概要と技術的な構成についてまとめました。

マイクロソフト、5月20日にナデラCEOがAIビジョンを語る特別イベント開催か。コンシューマー向け新型Surface PC発表の可能性 画像
ガジェット

マイクロソフト、5月20日にナデラCEOがAIビジョンを語る特別イベント開催か。コンシューマー向け新型Surface PC発表の可能性

マイクロソフトは5月20日(米現地時間)、「ハードウェアとソフトウェアにまたがるAIビジョン」に関する特別イベントを開催する模様です。複数の大手メディアに、同社のサティア・ナデラCEOが上記のテーマについて話すと予告したとのこと。

アップル、iPhoneへの対話型AI「Gemini」導入をGoogleと協議中(Bloomberg報道) 画像
テクノロジー

アップル、iPhoneへの対話型AI「Gemini」導入をGoogleと協議中(Bloomberg報道)

アップルは、「今年iPhoneソフトウェアに搭載されるいくつかの新機能を強化」する目的のため、GoogleとGemini AIの使用に関する協議に入っている模様です。

Nothing Phone (2a)予約購入で、Claude 3 Opusも使えるAI対話型深堀り検索サービス「Perplexity Pro」1年無料コードを提供。19日まで 画像
ガジェット

Nothing Phone (2a)予約購入で、Claude 3 Opusも使えるAI対話型深堀り検索サービス「Perplexity Pro」1年無料コードを提供。19日まで

英Nothing Technologyは、Nothing Phone (2a) の予約購入者向けに、対話型AIサブスクリプション「Perplexity Pro」1年分の無料アクセスコードを提供すると発表しました。19日までに購入したユーザーを対象とするため、猶予はわずかです。コードの使用期限は4月30日まで。

「公開するApple vs. 隠すOpenAI」アップルが300億パラメータのマルチモーダルAI「MM1」発表。重要論文5本を解説(生成AIウィークリー) 画像
テクノロジー

「公開するApple vs. 隠すOpenAI」アップルが300億パラメータのマルチモーダルAI「MM1」発表。重要論文5本を解説(生成AIウィークリー)

Appleは、高性能なMLLMを探るべく、モデルの構造や学習に使うデータの選び方がモデルの性能にどのように影響するかなどを詳しく分析した論文を公開しました。

自律型AIソフトウェアエンジニア「Devin」発表。課題から情報収集して環境構築・ビルド・デプロイまで 画像
テクノロジー

自律型AIソフトウェアエンジニア「Devin」発表。課題から情報収集して環境構築・ビルド・デプロイまで

AIスタートアップのCognitionが自律型のAIソフトウェアエンジニア「Devin」を発表した。Devinは人間と同様にコードエディタやコンソール、Webブラウザを用いて情報を参照し、コーディングやデバッグ作業を自律的に行える能力を持つようだ。

Google DeepMind、言葉の指示どおりゲームをプレイするAI「SIMA」発表。No Man's SkyやValheimで学習 画像
テクノロジー

Google DeepMind、言葉の指示どおりゲームをプレイするAI「SIMA」発表。No Man's SkyやValheimで学習

Google DeepMindは、自然言語の指示に従ってゲーム内でタスクを実行するAIエージェント「Scalable Instructable Multiworld Agent(SIMA)」を発表しました。

DeepMindではゲームの世界を「現実の世界同様、常に変化する目標を備えた豊かな学習環境」と捉えており、様々なルールがあるゲームの中でゲームプレイを学習することによって、幅広い環境で役立つ「AIエージェント」の開発に役立つとしています。

Google I/O 2024は5月14日開催。AIやAndroid 15新情報、Pixel新製品に期待 画像
ガジェット

Google I/O 2024は5月14日開催。AIやAndroid 15新情報、Pixel新製品に期待

Googleは開発者向け年次イベント「Google I/O」を、日本時間5月15日午前2時(現地時間5月14日午前10時)から開催します。

「生成AIグラビア実践ワークショップ」過去回アーカイブの販売を開始しました 画像
テクノロジー

「生成AIグラビア実践ワークショップ」過去回アーカイブの販売を開始しました

人気連載「生成AIグラビアをグラビアカメラマンが作るとどうなる?」の著者である西川和久さんを講師に迎えたオンラインワークショップ「生成AIグラビア実践ワークショップ」過去回アーカイブの販売を開始しました。

NVIDIAのフアンCEO、AIの進歩でプログラミングや計算機科学教育は重要でなくなったと発言。自然言語がプログラミング言語に 画像
テクノロジー

NVIDIAのフアンCEO、AIの進歩でプログラミングや計算機科学教育は重要でなくなったと発言。自然言語がプログラミング言語に

NVIDIA CEOのJensen Huang氏はAIの進化で人間の言葉がプログラミング言語となり、プログラミング教育は重要ではなくなったとし、プログラミングやコンピュータサイエンス教育を重視する一般的な意見とは反対の立場を表明した。

Midjourney、生成した人物の特徴を維持する「Character Reference」機能を追加 画像
テクノロジー

Midjourney、生成した人物の特徴を維持する「Character Reference」機能を追加

画像生成AIサービスMidjourneyは、複数の生成画像で一貫性を持った人物画像の生成に対応する「Character Reference」機能のテストを開始しました。

ゲーム内の「村人のセリフ」をChatGPTで大量生成する方法(第2回)。データを大量に出力する 画像
テクノロジー

ゲーム内の「村人のセリフ」をChatGPTで大量生成する方法(第2回)。データを大量に出力する

生成AIをゲーム開発の現場で活用している筆者が、ゲーム内テキストの作成、中でもいわゆるRPGの村人たちのセリフの生成を一から行う流れを解説します。第2回は、データを大量に作るところから改善すべき点まで。