数行のコード追加でStable Diffusion生成画像を高品質にする「FreeU」、Llama2を10万トークンに低コストで増やす手法「LongLoRA」など重要論文5本を解説(生成AIウィークリー)
生成AIの重要論文5本を解説。「数行のコードを足すだけ…」生成画像・動画の品質が向上「FreeU」、LLaMA2を10万トークンに低コストで増やす手法「LongLoRA」など。
Windows 11の「ペイント」大進化。26日に画像生成AIや背景除去、レイヤー機能を含むアップデート配信
米マイクロソフトは9月21日(現地時間)に開催したスペシャルイベントで、26日にWindows 11の最新アップデートを実施すると発表しました。
AI画像生成ツール「DALL・E 3」発表。ChatGPTとの統合で対話的に生成し、プロンプトの理解度向上も
OpenAIが、AI画像生成ツールの新バージョン「DALL・E 3」を発表しました。DALL・E 3は、入力したテキスト文を従来より忠実に、生成するアートへ反映することが可能になっています。
“好きな人の声”のオーディオブックを電子書籍から作るAI、AI画像を超高速生成する「InstaFlow」など重要論文5本を解説(生成AIウィークリー)
生成AIの注目すべき論文を解説する連載。今週は、マイクロソフトによる、“好きな人の声”のオーディオブックを電子書籍から作るAI、0.09秒で画像を生成するAI「InstaFlow」など。
Photoshopに心から感謝を。生成AI「Firefly」が大事な1枚の写真を甦らせてくれました(CloseBox)
この写真は部分的に欠けているけど、残りを見たい。そんな大事な写真をお持ちの方は、Photoshopを使うといいです。
Stable Diffusion開発元によるAI音楽生成サービス「Stable Audio」の可能性(CloseBox)
Stable Audioという新しい生成AIサービスが始まりました。さっそく使ってみました。
Adobe、無料ですぐ使える画像生成AI『Firefly』ウェブ版提供開始。Photoshopの「生成塗りつぶし」「生成拡張」も。権利クリア画像で学習
Adobeが独自の画像生成AI『Firefly』の正式提供を開始しました。
Pythonの高速なスーパーセットをうたうAI向け新言語「Mojo」、開発ツール公開
Pythonの上位互換で高速性をうたう新言語のMojoが、待望のコンパイラ登場となった。ただしLinuxのみ。
忘れられない人とのデュエットが、映像でも。それを実現してくれたAIサービス「HeyGen」のさらなる野望(CloseBox)
静止画とオーディオがあればリップシンクができる動画技術を使い、長年の夢を実現しました。その一方で、ディープフェイク悪用の可能性がある技術も登場しています。
生成AIに高校スポーツ記事を書かせた大手新聞社、誤りや品質の苦情続き一時取り下げ。所属記者も「掲載すべきでなかった」と発言
米国の新聞社Gannettは8月、AIが生成した地域の高校スポーツ大会の結果を伝える複数の記事が、非常に不自然な文章構成になっていたり、誤りや文章生成に失敗していると読者から指摘され問題化したのを受け、該当する記事のチェックと更新を行っています。
“最適化”した回答を出すGoogleの言語モデル「OPRO」、3D都市を無制限に生成するAI「CityDreamer」など重要論文5本を解説(生成AIウィークリー)
1週間分のAI論文をまとめる生成AIウィークリーは、“最適化”した回答を出すGoogleの言語モデル「OPRO」、無制限に3D都市を生成するAI「CityDreamer」など重要論文5本を解説しています。
これが新しいAIググる体験か。Googleの生成AI検索「SGE」、日本語実験の現在地(Google Tales)
待望の「Search Generative Experience」が8月30日に日本とインドでも使えるようになりました。5月から使えていた米国以外で使えるようになったのは、今のところこの2カ国のみだそうです。
Google、生成AIによる検索「SGE」を日本でも試験開始。質問に文章で回答、会話形式で再検索も
Googleが2023年5月のGoogle I/Oで発表し、米国で先行して実施していた生成AIによる検索体験(SGE:Search Generative Experience)の試験運用を日本とインドでも開始しました。デスクトップのChromeブラウザとAndroidおよびiOSのGoogleアプリで利用できます。
Google「Duet AI」サービス多数発表。Gmail代筆やMeet議事録、データ分析からコード生成まで全面採用(Google Cloud Next '23)
開催中のイベント「Google Cloud Next '23」で発表されたサービス群の刷新はAI「Duet AI」を冠したものだ。
Uber Eats、予算や好みでおすすめメニュー提示する注文支援AIチャットボットを開発中との報
Uberは、フードデリバリーサービスのUber Eatsに注文支援用AIチャットボットの導入を計画している模様です。
3秒の音声があれば本人そっくりの声で日本語・英語・中国語合成できる「VALL-E X」はやはり脅威。MSが非公開にした技術のOSS版を試して実感した(CloseBox)
「使い方を誤ればティープフェイクの音声版にもなり得る」とまでマイクロソフトが危険視していた技術が別の開発者によってオープンソース公開されました。
Metaが文章と音声を翻訳するオールインワンAI「SeamlessM4T」、コード専用生成AI「Code Llama」を投入するなど重要論文5本を解説(生成AIウィークリー)
Metaが文章と音声を翻訳するAI「SeamlessM4T」、コード専用生成AI「Code Llama」投入するなど、生成AIに関する重要論文5本を解説します。
エアコン「霧ヶ峰」新型は準ミリ波レーダーで脈拍測定し「感情」や集中度を計測、冷風で狙い覚醒促す機能まで。高齢者見守りサービスも(安蔵靖志)
三菱電機は2023年8月21日、ルームエアコン「霧ヶ峰」の最新モデルを発表。翌日に開催されたプライベート展示会ではメディア向けツアーも行われ、同社が2月にスタートした高齢者見守りサービス「MeAMOR」も紹介されました。ここでは注目の製品や機能などを解説します。
無料で25人のAIシンガー使い放題なボーカロイド「VOCALOID β-STUDIO」はどこが画期的なのか、パラメータ1つで歌ってもらってわかったこと(CloseBox)
ヤマハの「VOCALOID β-STUDIO」を実際に使ってみました。まだ半日程度ですが、いくつかわかったことがあります。
期間限定・無料で25人分のAIシンガーが使える試作品ボカロの受付開始。VOCALOID β-STUDIO、始まる(CloseBox)
これまで作品を作ってきたボカロPは、ヤマハの新しいVOCALOID技術を無償で試すチャンス。「VOCALOID β-STUDIO」の参加受付が始まりました。
生成AIグラビアをグラビアカメラマンが作るとどうなる?第六回:Stable Diffusionの基本2 / LoRAの概要と6つの例を紹介 (西川和久)
前回はモデルの1つであるCheckpointについていろいろお話した。今回はStable Diffusionが扱えるモデルの中で次によく使われるLoRAについてがお題となる。
好きな人の声で好きな文章を読ませるMicrosoftの音声AI「SpeechX」、映像から3Dシーンを生成するNVIDIA開発「Neuralangelo」のコード公開など重要論文5本を解説(生成AIウィークリー)
今週の生成AI注目論文は、任意の人の音声を合成できるマイクロソフトのText-to-Speechモデルなど5本です。
Web3・NFT・メタバースが「幻滅期」入り 「日本における未来志向型インフラ・テクノロジのハイプ・サイクル:2023年」発表
ガートナーのハイプサイクル、日本ではWeb3、NFT、メタバースが「幻滅期」入りしました。
生成AIは「過度な期待のピーク」期に。米ガートナー「先進テクノロジーのハイプサイクル2023年」を発表
ガートナーのハイプサイクル。今年はすでに多くのITエンジニアに聞き馴染みのあるキーワードが比較的保守的といえる場所に並んでいます。
Google、見ているページを生成AIで要約する新機能のテスト開始。長文記事も箇条書きとQA形式に変換
Googleは米国にて、iOSおよびAndroid用のGoogleアプリ内で、閲覧中のサイトにある長文を箇条書きに要約してくれる「SGE while browsing(ブラウジング中のSGE)」機能の初期テストを始めました。
25体の自律AIが住む街がオープンソース化、チラつき抑えた動画合成を生成するAI「DiffSynth」など重要論文5本を解説(生成AIウィークリー)
1週間分の生成AI主要論文を紹介する連載。今回は、25体の自律AIが住む町、“ちらつき”を抑えた動画合成を生成するAIなど。
AI動画が簡単に作れる「AnimateDiff」を試したらやりがい爆上がり。カスタム学習したあの子が自然に動いてるよ(CloseBox)
最近AnimateDiffというAI動画手法がすごいと各所で注目されています。
NVIDIAがHugging Faceと提携。AIモデルを選んでそのままNVIDIA DGXクラウドで学習可能に
NVIDIAが生成AIに関わる人なら必ずお世話になっているHugging Faceと提携しました。そこで提供するのはTraining Cluster as a Serviceと呼ばれるものです。
Bing AIチャットがChromeやSafariほか他社ブラウザで利用可能に。会話ターン数や履歴保存に制限
マイクロソフトはOpenAIのAI言語モデルを統合したBing Chatを、まもなくサードパーティ製Webブラウザにも提供することを発表しました。
生成AIグラビアをグラビアカメラマンが作るとどうなる?第五回:Stable Diffusionの基本1 / Checkpointとリアル系モデルの遷移 (西川和久)
Checkpointとは!?
盗作を回避する音楽生成AI「MusicLDM」、AIたちが協力しゲーム開発する「MetaGPT」、など重要論文5本を解説(生成AIウィークリー)
盗作をできるだけ避けて音楽生成するAI、複数のLLMが協力してソフトウェア開発を行うフレームワークなど、最新のAI論文5つを紹介します。
「明日」テーマにAIを活用したアート作品を募集。第二回AIアートグランプリ、開催決定
「第二回AIアートグランプリ」は第一回と同じ審査員構成ですが、今回は作品テーマが「明日」と決められています。
高品質画像生成AI「SDXL 1.0」リリース!導入方法と作例 (連載:生成AIグラビアをグラビアカメラマンが作るとどうなる? 第四回 西川和久)
SDXL 1.0リリース!
OpenAI、Android版ChatGPT公式アプリ配信開始。日本向けは事前登録中
OpenAIは7月26日、ChatGPTのAndroid版をリリースしました。現在、米国、インド、バングラデシュ、ブラジルでダウンロード可能となっており、来週以降さらに多くの国への展開を予定しているとのことです。
生成AIグラビアをグラビアカメラマンが作るとどうなる?第三回:実際の撮影とポーズ/構図の関係。openpose_handで指問題解決? (西川和久)
実際の撮影と呪文の関係は似てる!?
Android版ChatGPTアプリは来週配信、OpenAIが告知「GPT-4の頭が劣化」指摘にも回答
OpenAIが、Android版のChatGPTアプリを来週リリースするとツイートしました。iOS版は5月にリリースされ、当時Android版については「まもなく」とアナウンスしていましたが、感覚的にはわりと長い間が開いてのリリースとなります。
生成AIグラビアをグラビアカメラマンが作るとどうなる?第二回:「アジア美女」最新モデルBRAV6作例とネガティブプロンプトの基礎
グラビアカメラマンでありソフトウェアエンジニアでもある西川和久氏が、プロカメラマンの目線から画像生成AIによる実写風ポートレートを作成する連載の第二回をお届けします。
1枚の静止画から動画作成する「AnimateDiff」、Googleの画像学習改良版「HyperDreamBooth」など5本の重要論文を解説(生成AIウィークリー)
人物画像などの学習によく使われているDreamBoothを、開発元であるGoogleがさらに高速化。静止画1枚から一貫性のあるアニメーションを制作する手法など、最新論文から生成AIの重要技術5つを紹介。
生成AIグラビアをグラビアカメラマンが作るとどうなる?第一回:実在モデルで学習・LoRAでキャッチライト付加 (西川和久)
ベテランのグラビアカメラマンである西川和久氏がAIグラビア生成を始め、撮影した実在モデルの写真から本人了承のもとトレーニングまでしていると聞き、始めたきっかけやAIとの付き合い方、始めてみたい人へのTIPSをまとめてもらいました。(編集部)
生成AIをどう学習に利用するか。より具体的な議論になってきた(小寺信良)
教育界は今、生成AIの出現によって大きく動き始めようとしている。英国ではすでに教員が授業計画の作成や採点にAI技術を活用しており、機会も課題ももたらすものという認識を示した。
10億トークンを処理できるマイクロソフトの言語生成AI「LongNet」、喉のMRIからAI音声合成など5つの重要論文を解説(生成AIウィークリー)
毎週月曜日に、前週の重要な生成AI論文をピックアップする連載。第2回は、トークン数を10億にまで拡張できるAIモデルなどをセレクトして解説します。
AI翻訳のDeepLが「DeepL Japan 合同会社」設立、欧州以外で初の海外拠点
7月3日、AIを使ったオンライン翻訳サービスを展開する独DeepLが、日本法人「DeepL Japan 合同会社」を設立したと発表しました。
