音声文字おこし屋さん
by pessham

貼るだけで、音声をサクッと
"文字おこし"
stand.fm の URL、mp3 / m4a などの音声ファイル、Discord 音声入力を
Whisper + GPT-4o が高精度に文字起こし & 3 行要約。
もう長い音声を聞き返す時間は要りません。

📎 URLを貼って「もじ」とうつだけ
できること

stand.fm ワンクリック文字起こし
エピソード URL を貼って もじ と送るだけ。

ファイルアップロード対応
iPhoneのボイスメモなどからファイルアップロード対応。mp3 / wav / m4a ほか主要フォーマットを自動変換。

Discord ボイス録音入力
ボイスチャットで話した内容もそのままテキスト化(予定)。
要約 + SNS 投稿文作成
要点を 3 行で整理、X (Twitter) 用テンプレも自動生成。
プロンプトはいつでも自由に変更可能
Obsidian 連携
Vault に Markdown 保存 & 類似メモリンク。
よくある質問
文字起こしの精度は?
OpenAI Whisper を使用しており、日本語でも高精度です。環境音や早口の場合は若干の誤認識が発生します。
どのような音声ファイルに対応していますか?
mp3、wav、m4a、mp4、avi、mov など主要なフォーマットに対応しています。stand.fm の URL も直接貼り付けるだけで文字起こしできます。
文字起こしにはどのくらい時間がかかりますか?
音声の長さにもよりますが、通常 1-3 分程度で完了します。有料プランでは優先処理により更に高速化されます。
音声データのプライバシーは大丈夫ですか?
処理完了後、音声データは自動的に削除されます。文字起こし結果のみが一時的に保存され、外部への共有は一切行いません。
Botが反応しない場合はどうすればいいですか?
「もじ」とだけ送信するか、Botにメンションを付けて送信してください。それでも反応しない場合は一度Botを再招待してください。
無料版と有料版の違いは何ですか?
無料版は1日5回まで、音声20分までの制限があります。有料版では回数無制限、PREMIUM プランでは音声60分まで対応し、優先処理で高速化されます。