AI | テクノエッジ TechnoEdge

テクノロジー 2024 Jul 8

ChatGPT Artifactsができた？　GPT-4oでもClaudeみたいな楽しいプロンプト開発ができるのだ（CloseBox）

大規模言語モデルのClaudeが送り出した新機能、Artifactsを使った記事が思いのほか好評のようですが、問題が一つ。使用量制限がかかってしまい、次のアクションまで数時間待たされることが頻発しているのです。

松尾公也

テクノロジー 2024 Jul 4

45年前の初代ウォークマンからiPod、iPhoneと進化した音楽リスニング体験。Suno AI公式アプリの登場でどう変わるか（CloseBox）

45年前に発売された革命的デバイス、ウォークマン。そのアニバーサリーにふさわしいエポックメイキングなアプリが登場しました。

松尾公也

テクノロジー 2024 Jul 2

生成AIグラビアをグラビアカメラマンが作るとどうなる？第27回：SD3 Mediumリリース！Part2(西川和久)

前回に引き続きStable Diffusion 3 Mediumの話

西川和久

テクノロジー 2024 Jul 2

現実と超現実を動画AIが描く「Gen-3 Alpha」にできること、できないこと。老舗Runwayが投入したSora世代の高性能動画生成AI（CloseBox）

動画生成AIでは老舗のRunwayがGen-3 Alphaを一般公開しました。使えるユーザーはStandardプラン以上。筆者はそれに該当しているので使ってみました。

松尾公也

テクノロジー 2024 Jul 1

ドラムマシン、シンセ、サンプラーがわずか数分で完成。非プログラマーなのにClaude + Artifactsのプロンプト開発が楽しすぎて限度超える（CloseBox）

ノンプログラマーな自分が、大規模言語モデル（LLM）の助力で、初めてまともに動くプログラムを完成させることができました。

松尾公也

テクノロジー 2024 Jul 1

AI生成の動画を“5倍以上長く”する拡張モデル「ExVideo」、無音動画に“それっぽい音”を挿入できる「FoleyCrafter」など生成AI技術5つを解説（生成AIウィークリー）

この1週間の気になる生成AI技術をピックアップして解説する「生成AIウィークリー」（第53回）では、生成する動画時間の延長や無音ビデオに適した音を生成するなど動画AIに関する内容が盛りだくさんです。

山下裕毅（Seamless）

テクノロジー 2024 Jun 28

Soraレベルの超高性能動画生成Luma AI「Dream Machine」が2枚の元絵指定できる「キーフレーム」機能追加。弱点の「別人化問題」がこれで解消するか、試してみた（CloseBox）

Soraレベルの超高性能動画生成AI、Luma AIの「Dream Machine」に新しい機能が投入されました。プロンプトでの指定以外に、2枚の参照画像を入力し、それを始点と終点にできる、ある意味モーフィング的な機能です。

松尾公也

テクノロジー 2024 Jun 26

米国の主要レコード会社がAI作曲サービスSunoとUdioを提訴。訴訟の根拠となったヒット曲再現プロンプトを検証してみる（CloseBox）

いずれ起きるかなと思っていた、米音楽業界団体からAI作曲サービスへの訴訟がついに来ました。

松尾公也

テクノロジー 2024 Jun 24

プロ作成モデルに匹敵する写真1枚→3Dモデル生成「Unique3D」、アーティストが丁寧に作ったようなポリゴンメッシュ生成「MeshAnything」など生成AI技術5つを解説（生成AIウィークリー）

この1週間の気になる生成AI技術をピックアップして解説する、生成AIウィークリー（第52回）では、オープンソースで成長する動画生成AI「Open-Sora」の新バージョンや、精度の伸び代が見込まれるAIによる3Dメッシュ生成分野から「Unique3D」と「MeshAnything」を取り上げます。

山下裕毅（Seamless）

テクノロジー 2024 Jun 20

WWDC24、Luma Dream Machineについて語るポッドキャスト第59回を配信（TechnoEdge-Side）

テクノエッジ編集部では、人気のテック系ポッドキャスト「backspace.fm」の中に「TechnoEdge-Side」（テクノエッジ・サイド）というチャンネルを設け、週1回のペースでお届けしています。

テクノエッジ編集部

テクノロジー 2024 Jun 19

新世代AIリップシンク対決。感情豊かで高速な「Hedra Character-1」とオープンソースだがNVIDIA GPU必須「Hallo」。どっちが使い物になるか試してみた結果（CloseBox）

オーディオに合わせたリップシンクができる新しい技術が登場しました。「Hedra」という、これまで聞いたことのないサービスです。

松尾公也

テクノロジー 2024 Jun 18

直感的コントロールも予告した話題の高性能動画AI、Luma AI「Dream Machine」、10秒以上の動画生成が可能になったので試してみた（CloseBox）

SoraやKLINGレベルの「今使える代替動画生成AIサービス」として登場したLuma AIの「Dream Machine」が機能追加のアップデートしました。従来の5秒からのExtend（延長）が可能になりました。

松尾公也

テクノロジー 2024 Jun 17

生成AIグラビアをグラビアカメラマンが作るとどうなる？第26回：ローカルで使えるSD3 Mediumリリース！実力を試す(西川和久)

ローカルPCで生成可能なStable Diffusion 3 Medium、遂に登場！

西川和久

テクノロジー 2024 Jun 17

WWDC24総括とLuma AIを語るポッドキャスト第59回を本日（6月17日）正午にライブ配信

テクノエッジ編集部では、「TechnoEdge-Side」（テクノエッジ・サイド）を週1回のペースでお届けしています。その第59回放送を、本日（6月17日）正午（12時）に、YouTubeで行います。

テクノエッジ編集部

テクノロジー 2024 Jun 17

画像内キャラに楽曲を歌わせる「Hallo」、“行列の掛け算なし”にLLMの開発が可能な「MatMul-Free LM」など重要論文5本を解説（生成AIウィークリー）

第51回の生成AIウィークリーでは、この1週間の興味深い生成AIに関する研究論文をピックアップし、解説します。特に注目したいのは、大規模言語モデル（LLM）の開発において、常識とされている行列乗算を排除するという「MatMul-Free LM」です。この研究は、GitHubにおいて2000件（執筆現在）のStarを獲得しており、注目されています。

山下裕毅（Seamless）

テクノロジー 2024 Jun 14

もうSoraは不要なのか。動画生成AIの新基準、Luma AI「Dream Machine」をサブスクしてわかった「ハリー・ポッターに出てくるような魔法」の使いこなし術（CloseBox）

テキストプロンプトからリアルな動きのある映像を生成できる動画生成AISora、KLINGが使えずにヤキモキしていた人々が大挙して押し寄せた「Luma Dream Machine」。このサービスの有償プランに申し込んで使ってみたので、その使い方のコツをお伝えします。

松尾公也

テクノロジー 2024 Jun 13

今そこにあるSora、現時点最高クラスの誰でも使える動画生成AI「Luma Dream Machine」が人気すぎて数時間の待ち行列（CloseBox）

今使えるSoraのライバルが登場しました。

松尾公也

テクノロジー 2024 Jun 13

短い演奏・歌を十数秒で4分の完成曲に。作曲AIが未完成曲をフィニッシュするSunoの新機能を試して見つけた黄金パターン（CloseBox）

オーディオをアップロードして、そこから曲を拡張していく機能がようやくSunoでも使えるようになりました。

松尾公也

テクノロジー 2024 Jun 12

Apple Intelligenceはどのように開発されたのか？　中核をなすオンデバイスAIモデルとPrivate Cloud Computeについて今わかっていること（CloseBox）

アップルが打ち出したAIフレームワーク「Apple Intelligence」ですが、個々の機能についてはわかるものの、全体像がつかみにくいものになっています。

松尾公也

テクノロジー 2024 Jun 10

手のひら投影AIデバイス「Humane Ai Pin」はGTP-4oとGemini両刀使い。アップデートされた使い勝手をチェックした

サンフランシスコのスタートアップHumaneが開発した手のひら投影型AIデバイス「Ai Pin」に注目が集まっています。

五島正浩

テクノロジー 2024 Jun 10

中国AIが加速。Soraに匹敵する中国の動画生成AI「KLING」、中国アリババの最新オープンLLM「Qwen 2」登場など生成AI関連技術5つを紹介（生成AIウィークリー）

週次で生成AI関連技術5つを紹介する連載。中国のショート動画アプリ開発チーム「快手」が手がけるSoraに匹敵する動画生成AI「KLING」など。

山下裕毅（Seamless）

テクノロジー 2024 Jun 6

AI作曲サービスのUdio、アップロードした音楽を前後に拡張できる新機能「Audio uploads」でSunoを出し抜く（CloseBox）

AI作曲サービスのUdioが、有償サブスクライバー向けに新機能「Audio uploads」を発表しました。ユーザーがオーディオクリップをアップロードし、それをプロンプトを使って前後に継ぎ足すことができるというものです。

松尾公也

テクノロジー 2024 Jun 3

動画AIが豊作。アニメ絵2枚の間の“中割り”を生成し映像化するAI「ToonCrafter」、画像内キャラを滑らかに踊らせるAI「MusePose」など重要論文5本を解説（生成AIウィークリー）

生成AIの重要論文5本を解説する連載。今週は、アニメの“中割り”を生成してアニメーションに仕上げる「ToonCrafter」、1枚の画像とモーションデータからダンス動画を生成するAIモデル「MusePose」など。

山下裕毅（Seamless）

テクノロジー 2024 May 31

AI作曲サービスは「長さ」の戦いに。Udioが2分10秒の生成に対応、Sunoは全ユーザーに4分生成を開放（CloseBox）

AI作曲の覇権を競うSunoとUdioが相次いで機能強化を発表しました。

松尾公也

ガジェット 2024 May 27

iOS 18ではAIがテキストメッセージからカスタム絵文字をその場で生成、Siriとのより自然な対話が実現する可能性あり？

アップルは6月10日～(現地時間）の年次開発者会議WWDCにて次期iOS 18を正式発表し、生成AI機能にかなりの比重を置くと予想されています。新規のチャットボット以上に、お馴染みの標準アプリをAIにより強化し、実用性を重視しているという具合です。

Kiyoshi Tane

カルチャー 2024 May 27

マイクロソフトのCopilot+ PC戦略とは？　ポッドキャスト第56回を本日（5月27日）正午にライブ配信（TechnoEdge-Side）

テクノエッジ編集部では、「TechnoEdge-Side」（テクノエッジ・サイド）を週1回のペースでお届けしています。その第56回放送を、本日（5月27日）正午（12時）に、YouTubeで行います。

テクノエッジ編集部

テクノロジー 2024 May 27

“株”選びにGPT-4の利益予測は使えるのか？　“文学作品”を翻訳する複数AIが働く出版社「TransAgents」など重要論文5本を解説（生成AIウィークリー）

生成AIに関する重要論文を解説する連載。今回は、“文学作品”を翻訳する実際の出版社を真似たAI会社「TransAgents」、GPT-4で企業の財務諸表を分析し将来の利益を予測……など5本。

山下裕毅（Seamless）

テクノロジー 2024 May 25

AI作曲「Suno」新バージョンがWAV高音質化、最長4分の曲を一発でエンディングまで完成。無修正で良曲量産可能に（CloseBox）

このところUdioやSonautoの新機能搭載で押され気味だったAI作曲サービスの「Suno」が反撃に出ました。

松尾公也

テクノロジー 2024 May 24

GPT-4o vs. Project Astra。マルチモーダルLLM戦争を語るポッドキャスト第55回を配信（TechnoEdge-Side）

テクノエッジ編集部では、人気のテック系ポッドキャスト「backspace.fm」の中に「TechnoEdge-Side」（テクノエッジ・サイド）というチャンネルを設け、週1回のペースでお届けしています。

テクノエッジ編集部

テクノロジー 2024 May 23

マインクラフトをGPT-4oと一緒にプレイ、マイクロソフトがCopilotのAI新機能をデモ。近日中に提供

Minecraftをプレイするときに、AIアシスタント「Copilot」と会話できる機能をMicrosoftが発表しました。21日にSNSで公開された映像では、プレイヤーがCopilotにアイテム制作のアドバイスを求めたり、Copilotが脅威への対処法を知らせる様子が映されています。

関根慎一

テクノロジー 2024 May 23

バッジ型AIデバイスAi PinのHumane社、早くも身売り検討中？発売から約1か月（Bloomberg報道）

Humaneは2023年11月、同社の最初で唯一の製品であるAI Pinを発表、2024年4月に出荷を開始し始めたばかりでしたが、新しい報道によると現在、会社の売却を検討しているとのことです。

Munenori Taniguchi

テクノロジー 2024 May 23

中国で『AI習近平』誕生。「習近平思想」記した著書十数冊や公式文書で強化

中国国家サイバースペース管理局（CAC）は、習近平国家主席の思想と政治哲学に関する著書などでトレーニングされた大規模言語モデル（LLM）を搭載するAIシステムを開発しました。

Munenori Taniguchi

テクノロジー 2024 May 22

生成AIグラビアをグラビアカメラマンが作るとどうなる？第25回：三拍子揃った新Upscale手法 ControlNet 852_a_clone_xlを試す (西川和久)

現役グラビアカメラマンでありエンジニアでもある西川和久氏による生成AIグラビア連載の第25回は、画像生成と切っても切り離せないアップスケールの新技術編。

西川和久

テクノロジー 2024 May 22

スカヨハ、ChatGPTの声提供をサム・アルトマンから繰り返し提案され断っていたと明かす。そっくりの『Sky』には衝撃と怒りを声明

ハリウッドスターのスカーレット・ヨハンソンは、声の使用を断ったにもかかわらずOpenAIが「不気味なほど自分に似た」AI音声を発表したことに「ショックを受け、怒り」を覚えたと述べ、同社のサム・アルトマンCEOに対し「信じられない」とする声明を出しました。

Munenori Taniguchi

ガジェット 2024 May 22

クアルコム、Snapdragon X Elite搭載のMac mini風ミニデスクトップPCを発表。ARM版Windowsアプリ開発向け

クアルコムは、マイクロソフトが発表した新しいSurfaceシリーズにも採用されているSnapdragon X Elite搭載のWindowsミニデスクトップPCを発表しました。価格は899ドル（約14万円）で、6月18日発売予定です。

Munenori Taniguchi

テクノロジー 2024 May 20

Pythonのように書けてGPU上で並列処理できる新プログラミング言語「Bend」、2D画像→3Dを高精度生成するGoogle「CAT3D」など重要論文5本を解説（生成AIウィークリー）

1週間分の生成AI関連論文の中から重要なものをピックアップし、解説をする連載です。今回は、GPU上でネイティブ動作する並列処理が可能な新プログラミング言語「Bend」とランタイムシステム「HVM2」、大規模言語モデルは追加学習や新知識で幻覚生成が増加。Googleなどが調査などを紹介。

山下裕毅（Seamless）

テクノロジー 2024 May 17

Gemini Advancedで次世代AIモデルGemini 1.5 Pro解禁。音声会話Gemini Liveやカスタム版Gemsなど新機能

Googleは5月14日～15日（現地時間）、年次開発者会会議Google I/Oを開催しました。直前にPixel 8aが発表されていたこともあり、AI一色だったGoogle I/Oですが、一般ユーザーが身近に感じられそうなのがGemini Advancedのアップデートでしょう。

山本竜也

テクノロジー 2024 May 17

技術書典16に出展『グラビアカメラマンが教える生成AIグラビア実践ハンドブック』を制作しました

テクノエッジは、5月25日から6月9日にかけてオンラインおよびオフラインで開催されるイベント「技術書典16」に出展します。

テクノエッジ編集部

テクノロジー 2024 May 17

成功させたいスタートアップの条件とは？　エンジェル投資家川崎裕一さんゲストの第54回を配信（TechnoEdge-Side）

テクノエッジ編集部では、人気のテック系ポッドキャスト「backspace.fm」の中に「TechnoEdge-Side」（テクノエッジ・サイド）というチャンネルを設け、週1回のペースでお届けしています。

テクノエッジ編集部

テクノロジー 2024 May 15

Google、AIが通話を聴いてサギか判定・警告する機能をデモ。Gemini Nanoでローカル動作

Googleは年次開発者会議「Google I/O」にて、Androidスマートフォンに掛かってきた電話が詐欺の疑いがある場合、ユーザーに警告する機能をテスト中だと発表しました。

Kiyoshi Tane

テクノロジー 2024 May 15

Google、Gemini AIのビデオ検索デモで早速やらかす。カメラのフィルム巻き上げレバーが動かないなら「裏ぶたを開けてフィルムを取り出す」？

日本時間5月15日午前2時より開催されたGoogle I/Oより。Googleは今回のイベントで、Gemini AIをさらに多様なプロダクトに組み込んでいることを大きくアピールしました。

Munenori Taniguchi

テクノロジー 2024 May 15

Google、動画生成AIモデル『Veo』発表。高解像度で一分超、撮影用語などプロンプト再現性と高い一貫性、動画の一部編集も

5月15日の Google I/O基調講演で、Googleが新たな動画生成AIモデル『Veo』を発表しました。

Ittousai

AI

ChatGPT Artifactsができた？ GPT-4oでもClaudeみたいな楽しいプロンプト開発ができるのだ（CloseBox）

45年前の初代ウォークマンからiPod、iPhoneと進化した音楽リスニング体験。Suno AI公式アプリの登場でどう変わるか（CloseBox）

生成AIグラビアをグラビアカメラマンが作るとどうなる？第27回：SD3 Mediumリリース！Part2(西川和久)

現実と超現実を動画AIが描く「Gen-3 Alpha」にできること、できないこと。老舗Runwayが投入したSora世代の高性能動画生成AI（CloseBox）

ドラムマシン、シンセ、サンプラーがわずか数分で完成。非プログラマーなのにClaude + Artifactsのプロンプト開発が楽しすぎて限度超える（CloseBox）

AI生成の動画を“5倍以上長く”する拡張モデル「ExVideo」、無音動画に“それっぽい音”を挿入できる「FoleyCrafter」など生成AI技術5つを解説（生成AIウィークリー）

Soraレベルの超高性能動画生成Luma AI「Dream Machine」が2枚の元絵指定できる「キーフレーム」機能追加。弱点の「別人化問題」がこれで解消するか、試してみた（CloseBox）

米国の主要レコード会社がAI作曲サービスSunoとUdioを提訴。訴訟の根拠となったヒット曲再現プロンプトを検証してみる（CloseBox）

プロ作成モデルに匹敵する写真1枚→3Dモデル生成「Unique3D」、アーティストが丁寧に作ったようなポリゴンメッシュ生成「MeshAnything」など生成AI技術5つを解説（生成AIウィークリー）

WWDC24、Luma Dream Machineについて語るポッドキャスト第59回を配信（TechnoEdge-Side）

新世代AIリップシンク対決。感情豊かで高速な「Hedra Character-1」とオープンソースだがNVIDIA GPU必須「Hallo」。どっちが使い物になるか試してみた結果（CloseBox）

直感的コントロールも予告した話題の高性能動画AI、Luma AI「Dream Machine」、10秒以上の動画生成が可能になったので試してみた（CloseBox）

生成AIグラビアをグラビアカメラマンが作るとどうなる？第26回：ローカルで使えるSD3 Mediumリリース！実力を試す(西川和久)

WWDC24総括とLuma AIを語るポッドキャスト第59回を本日（6月17日）正午にライブ配信

画像内キャラに楽曲を歌わせる「Hallo」、“行列の掛け算なし”にLLMの開発が可能な「MatMul-Free LM」など重要論文5本を解説（生成AIウィークリー）

もうSoraは不要なのか。動画生成AIの新基準、Luma AI「Dream Machine」をサブスクしてわかった「ハリー・ポッターに出てくるような魔法」の使いこなし術（CloseBox）

今そこにあるSora、現時点最高クラスの誰でも使える動画生成AI「Luma Dream Machine」が人気すぎて数時間の待ち行列（CloseBox）

短い演奏・歌を十数秒で4分の完成曲に。作曲AIが未完成曲をフィニッシュするSunoの新機能を試して見つけた黄金パターン（CloseBox）

Apple Intelligenceはどのように開発されたのか？ 中核をなすオンデバイスAIモデルとPrivate Cloud Computeについて今わかっていること（CloseBox）

手のひら投影AIデバイス「Humane Ai Pin」はGTP-4oとGemini両刀使い。アップデートされた使い勝手をチェックした

中国AIが加速。Soraに匹敵する中国の動画生成AI「KLING」、中国アリババの最新オープンLLM「Qwen 2」登場など生成AI関連技術5つを紹介（生成AIウィークリー）

AI作曲サービスのUdio、アップロードした音楽を前後に拡張できる新機能「Audio uploads」でSunoを出し抜く（CloseBox）

動画AIが豊作。アニメ絵2枚の間の“中割り”を生成し映像化するAI「ToonCrafter」、画像内キャラを滑らかに踊らせるAI「MusePose」など重要論文5本を解説（生成AIウィークリー）

AI作曲サービスは「長さ」の戦いに。Udioが2分10秒の生成に対応、Sunoは全ユーザーに4分生成を開放（CloseBox）

iOS 18ではAIがテキストメッセージからカスタム絵文字をその場で生成、Siriとのより自然な対話が実現する可能性あり？

マイクロソフトのCopilot+ PC戦略とは？ ポッドキャスト第56回を本日（5月27日）正午にライブ配信（TechnoEdge-Side）

“株”選びにGPT-4の利益予測は使えるのか？ “文学作品”を翻訳する複数AIが働く出版社「TransAgents」など重要論文5本を解説（生成AIウィークリー）

AI作曲「Suno」新バージョンがWAV高音質化、最長4分の曲を一発でエンディングまで完成。無修正で良曲量産可能に（CloseBox）

GPT-4o vs. Project Astra。マルチモーダルLLM戦争を語るポッドキャスト第55回を配信（TechnoEdge-Side）

マインクラフトをGPT-4oと一緒にプレイ、マイクロソフトがCopilotのAI新機能をデモ。近日中に提供

バッジ型AIデバイスAi PinのHumane社、早くも身売り検討中？発売から約1か月（Bloomberg報道）

中国で『AI習近平』誕生。「習近平思想」記した著書十数冊や公式文書で強化

生成AIグラビアをグラビアカメラマンが作るとどうなる？第25回：三拍子揃った新Upscale手法 ControlNet 852_a_clone_xlを試す (西川和久)

スカヨハ、ChatGPTの声提供をサム・アルトマンから繰り返し提案され断っていたと明かす。そっくりの『Sky』には衝撃と怒りを声明

クアルコム、Snapdragon X Elite搭載のMac mini風ミニデスクトップPCを発表。ARM版Windowsアプリ開発向け

Pythonのように書けてGPU上で並列処理できる新プログラミング言語「Bend」、2D画像→3Dを高精度生成するGoogle「CAT3D」など重要論文5本を解説（生成AIウィークリー）

Gemini Advancedで次世代AIモデルGemini 1.5 Pro解禁。音声会話Gemini Liveやカスタム版Gemsなど新機能

技術書典16に出展『グラビアカメラマンが教える 生成AIグラビア実践ハンドブック』を制作しました

成功させたいスタートアップの条件とは？ エンジェル投資家 川崎裕一さんゲストの第54回を配信（TechnoEdge-Side）

Google、AIが通話を聴いてサギか判定・警告する機能をデモ。Gemini Nanoでローカル動作

Google、Gemini AIのビデオ検索デモで早速やらかす。カメラのフィルム巻き上げレバーが動かないなら「裏ぶたを開けてフィルムを取り出す」？

Google、動画生成AIモデル『Veo』発表。高解像度で一分超、撮影用語などプロンプト再現性と高い一貫性、動画の一部編集も

ChatGPT Artifactsができた？　GPT-4oでもClaudeみたいな楽しいプロンプト開発ができるのだ（CloseBox）

Apple Intelligenceはどのように開発されたのか？　中核をなすオンデバイスAIモデルとPrivate Cloud Computeについて今わかっていること（CloseBox）

マイクロソフトのCopilot+ PC戦略とは？　ポッドキャスト第56回を本日（5月27日）正午にライブ配信（TechnoEdge-Side）

“株”選びにGPT-4の利益予測は使えるのか？　“文学作品”を翻訳する複数AIが働く出版社「TransAgents」など重要論文5本を解説（生成AIウィークリー）

技術書典16に出展『グラビアカメラマンが教える生成AIグラビア実践ハンドブック』を制作しました

成功させたいスタートアップの条件とは？　エンジェル投資家川崎裕一さんゲストの第54回を配信（TechnoEdge-Side）