E
画像・音声・動画を自動解析してAIが説明
by el-el-san
画像ファイルを解析してAIが内容を説明・分析します。JPG、PNG、GIF、WebPなど複数の形式に対応。 音声ファイル(MP3、WAV、AAC、FLACなど)をアップロードしてAIが曲のジャンル、雰囲気、内容などを自動判定します。 動画ファイルを解析してシーン内容や音声、字幕などをAIが自動で理解して説明します。 ローカルファイルとWebのURLの両方に対応しており、大きなファイルは自動的にチャンク処理されて効率的に解析されます。 カスタムプロンプトで指定した条件で解析でき、詳細モードで詳しい結果を取得できます。 大量の画像や動画をAIに分析させて業務効率化したいマーケター・クリエイター 音楽コンテンツの自動タグ付けやジャンル分類が必要な音楽制作者・キュレーター 動画コンテンツの自動要約や内容把握が必要なメディア企業・編集者 URLで共有されたメディアを素早く内容確認したい営業・企画担当者 Gemini APIを使用した多形式メディア解析ツール。ローカルファイルパスまたはURLを入力として受け取り、AI解析を実行します。サポート形式は画像(JPG、JPEG、PNG、GIF、WebP、BMP、TIFF)、音声(MP3、WAV、AAC、FLAC、OGG、M4A)、動画(MP4、AVI、MOV、MKV、WebM)。使用方法は python analyze.py [ファイルパス/URL]、カスタムプロンプト指定時は --prompt オプション、詳細モードは --verbose オプションで実行。環境変数 GEMINI_API_KEY が必須。大きなファイルは自動的にチャンク処理され、出力には解析ファイル情報とAIによる詳細な分析内容が含まれます。