【2026年最新】AIがヤバい!画像・動画生成のトレンド最前線!
「え、これAIが作ったの!?」AI画像・動画生成の最新トレンド
最近、そんな驚きが日常になってきましたね!特にAIによる画像や動画の進化は、もはやSF映画の世界。今回は、ここ1週間のAI画像・動画界隈のホットな話題を、事実確認を行った上で、ぎゅっとまとめてカジュアルにお届けします!
🎬 ローカルPCで「Sora 2」級の動画が作れるってホント!?
これまで「すごい動画」を作るには、専門のサービスを使うのが当たり前でした。でも、ついに時代が変わったんです!なんと、お家のPCでも「Sora 2」に匹敵するようなハイクオリティな動画が作れるように!
2024年秋には「うーん、これは動画…?」というレベルだったのが、わずか1年で驚異的な進化を遂げました。まさに、クリエイター新時代の幕開けですね!
🚀 話題の最新技術をチラ見せ!
この進化を支える、注目の技術を3つご紹介します。
1. wanvideo_SCAIL_pose_control:ダンスの完コピが可能に!
2025年12月に清華大学とZhipu AI(Z.ai)が発表した「SCAIL」(Studio-Grade Character Animation via In-Context Learning)は、リファレンス動画のダンスや動作を完全にコピーできる革新的な技術です。
主な特徴:
- 3D一貫性のあるポーズ制御: 従来の2Dポーズではなく、3D空間で深度を理解したポーズ表現を使用
- 参照画像1枚+動画: 1枚のキャラクター画像と動きの参照動画があれば、高精度な動作転送が可能
- マルチキャラクター対応: 複数のキャラクターが同時に登場するシーンでも、それぞれの個性を保ちながらアニメーション
- 複雑な動作に強い: ダンス、武術、アクロバットなど高速で複雑な動きも正確に再現
ComfyUIで利用可能で、24GB以上のVRAMがあれば最高品質で、12-16GBでもGGUF量子化版で動作します。
参照URL:
- arXiv論文 - SCAIL公式ページ
- RunComfy - SCAILワークフロー
- Apatero Blog - SCAIL完全ガイド
- GitHub - ComfyUI-WanVideoWrapper
2. LongCat Avatar:「歌ってみた」動画もAIで!
Meituan(美団)のLongCat研究チームが開発した「LongCat-Video-Avatar」は、画像1枚と音源さえあれば、長尺のリップシンク動画が作れる画期的なモデルです。
主な特徴:
- 13.6億パラメータ: 大規模モデルによる高品質な生成
- 最大2分間の動画生成: 長時間でも品質劣化なし、アイデンティティの一貫性を維持
- 完璧なリップシンク: 音声波形を解析し、唇の動きを完璧に同期
- 自然な動作: 頭の動き、表情、肩の動きなど、リアルなアバター動作
- 多言語対応: 140以上の言語に対応し、各言語で自然な口の動き
- 歌唱対応: スピーチだけでなく、歌を歌わせることも可能
価格: 480pで$0.04/秒、720pで$0.08/秒(最低5秒=$0.20から)
参照URL:
3. LTX-2:映像と音声を同時生成する革命児!
2026年1月6日、Lightricksが「LTX-2」をオープンソース化しました。プロンプト(指示文)だけで、キャラクターにセリフを喋らせ、背景音や効果音も含めた完全な動画を生成できます。
主な特徴:
- 19億パラメータ: 映像14億+音声5億の非対称デュアルストリーム構造
- 最大4K・50fps: プロの映像制作に匹敵する高品質出力
- 最大20秒の動画生成: 映像と音声が完全に同期
- 日本語対応: 日本語での歌唱も可能(ひらがな・カタカナが特に高品質)
- リップシンク: キャラクターの口の動きと音声が自然に同期
- 環境音も自動生成: セリフだけでなく、足音、風の音、食器の音なども生成
- ComfyUI対応: ローカル環境で実行可能
重要なポイント: 言語によって品質が異なり、英語が最も高品質。日本語は実用レベルですが、方言や複雑な表現では精度が低下する場合があります。
参照URL:
- NVIDIA公式 - LTX-2クイックスタートガイド
- The Decoder - LTX-2詳細レビュー
- GitHub - LTX-2公式リポジトリ
- Hugging Face - LTX-2
- WEEL - LTX-2日本語解説
- AICU note - LTX-2日本語歌唱実験
🎨 商用サービスも進化が止まらない!
オープンソースが盛り上がる一方、おなじみの商用サービスも負けていません。
Sora 2:現実と見分けがつかないレベル
2025年9月30日にリリースされたOpenAIの「Sora 2」は、物理演算の改善と最大25秒の動画生成が可能になりました。音声生成機能も統合され、映像と音声が同期した動画を作成できます。
ただし、2026年1月からは無料ユーザーのアクセスが制限されていますので、ご注意ください。
参照URL:
Veo 3.1:4K出力とGemini 3 Pro連携
Google DeepMindの「Veo 3.1」は、4K解像度での出力に対応し、縦型動画(9:16)のネイティブサポートを追加。Gemini 3 Proとの連携により、プロンプトの理解力が飛躍的に向上しています。
参照URL:
📺 動画広告の世界もAI一色に
サイバーエージェントは、2026年中にSNS動画広告をAIで完全自動生成することを目指しています。2025年10月には「日本一のAI動画を追求するセンター」を新設し、従来数千万円かかっていた動画制作を300万円(3本)で提供する「ブランド300万動画」サービスを開始。制作期間も3ヶ月から1.5~2週間に短縮されました。
これからは、AIが作った広告を目にするのが当たり前になるかもしれませんね。
参照URL:
🖼️ 画像生成は「作る」から「直す」へ
これまでの画像生成AIは「いかに良い絵を描くか」が中心でした。でも、これからは「いかに上手く修正するか」がトレンドに。
Adobe Firefly:プロ向け編集機能を強化
2025年12月、AdobeはRunwayと提携してFireflyを大幅強化。ブラウザ上で動画の生成から編集まで完結できる環境が整いました。
Nano Banana Pro:10億枚突破の人気モデル
2025年11月20日にリリースされたGoogleの「Nano Banana Pro」(正式名称:Gemini 3 Pro Image)は、最大4K(3840×2160)の高解像度画像を出力でき、わずか53日間で10億枚以上の画像が生成されました。
主な特徴:
- 多言語での正確なテキストレンダリング
- 最大14枚の参照画像を同時にアップロード可能
- ブランドの一貫性を保った画像生成
参照URL:
💡 まとめ:2026年、AIクリエイティブから目が離せない!
主要トレンド
- ローカル環境の進化: LTX-2やSCAILなど、自宅のPCで高品質な動画が作れる時代に
- 音声合成との完全統合: 映像だけでなく、セリフ、効果音、BGMまで一体で生成
- モーションコントロール技術: ダンスや複雑な動作の転送が実用レベルに到達
- 「編集」機能の充実: 生成だけでなく、精密な修正・編集が可能に
- 日本語対応の進化: 日本語での歌唱や会話生成が実用レベルに
- 商用化の加速: サイバーエージェントの事例のように、制作コストと期間が劇的に短縮
2026年末には、本当にSora 2レベルの動画が誰でも作れるようになっているかも!?
これからのAIの進化、一緒に楽しんでいきましょう!
📚 参考情報(完全版)
動画生成AI - オープンソース
SCAIL(モーション転送):
- https://arxiv.org/html/2512.05905v1
- https://www.runcomfy.com/comfyui-workflows/scail-model-in-comfyui-pose-based-character-animation-workflow
- https://apatero.com/blog/wan-scail-character-animation-guide-2025
- https://github.com/kijai/ComfyUI-WanVideoWrapper/
LongCat Avatar(リップシンク):
- https://www.longcatavatar.net/
- https://huggingface.co/meituan-longcat/LongCat-Video-Avatar
- https://meigen-ai.github.io/LongCat-Video-Avatar/
- https://wavespeed.ai/blog/posts/introducing-wavespeed-ai-longcat-avatar-on-wavespeedai/
LTX-2(音声付き動画生成):
- https://www.nvidia.com/en-us/geforce/news/rtx-ai-video-generation-guide/
- https://the-decoder.com/lightricks-open-sources-ai-video-model-ltx-2-challenges-sora-and-veo/
- https://github.com/Lightricks/LTX-2
- https://huggingface.co/Lightricks/LTX-2
- https://weel.co.jp/media/tech/ltx-2/
- https://note.com/aicu/n/n2c3a33b0583c
動画生成AI - 商用サービス
Sora 2:
Veo 3.1:
サイバーエージェント:
- https://xtrend.nikkei.com/atcl/contents/18/01301/00005/
- https://www.cyberagent.co.jp/news/detail/id=32619
画像生成AI
Nano Banana Pro:
- https://blog.google/innovation-and-ai/products/nano-banana-pro/
- https://9to5google.com/2026/01/12/gemini-nano-banana-pro-milestone/
D-aerial HP: https://d-aerial.com/services/ai-video
*AIツールプラットフォーム Reelmind https://reelmind.ai?aff=NI0E77
*AIエージェントツール Gen spark (1000クレジット追加付与):「招待コード」
https://www.genspark.ai/invite_member?invite_code=MGUyMmZhOWNMZTkwZExmZDc3TGE3YWVMY2ZlYmRiY2M0OWY0
*Kindle AIトレンド2026年1月 https://www.amazon.co.jp/dp/B0GLHCB4YG
*D-aerial HP:: https://d-aerial.com/services/ai-video
*無制限音楽リリースサイト(Distrokid): https://distrokid.com/vip/seven/8321530
*youtube music
https://music.youtube.com/playlist?list=OLAK5uy_lRIuSP-3blAmGa4FSDswiuKlQ3Ztqp00I
*Spotify/Apple music/iTunes
https://distrokid.com/hyperfollow/daerialmusic/--dark-winged-angel
*Noteブログ: https://note.com/d_aerial/n/na621d17c554f?sub_rt=share_pw
上記アフィリエイトリンク含む