音声文字おこし屋さん by pessham

貼るだけで、音声をサクッと
"文字おこし"

stand.fm の URL、mp3 / m4a などの音声ファイル、Discord 音声入力を
Whisper + GPT-4o が高精度に文字起こし & 3 行要約。
もう長い音声を聞き返す時間は要りません。

無料で試す（Bot を招待）詳しい手順はマニュアルを見る

📎 URLを貼って「もじ」とうつだけ

できること

stand.fm ワンクリック文字起こし

エピソード URL を貼ってもじと送るだけ。

ファイルアップロード対応

iPhoneのボイスメモなどからファイルアップロード対応。mp3 / wav / m4a ほか主要フォーマットを自動変換。

Discord ボイス録音入力

ボイスチャットで話した内容もそのままテキスト化（予定）。

開発中

📝

要約 + SNS 投稿文作成

要点を 3 行で整理、X (Twitter) 用テンプレも自動生成。
プロンプトはいつでも自由に変更可能

🔗

Obsidian 連携

Vault に Markdown 保存 & 類似メモリンク。

開発中

使い方は 3 ステップ

Bot をサーバーに招待

URL を貼る / 音声をアップロード

文字起こし & 要約を生成

詳細手順はマニュアルをご覧ください。

料金プラン

FREE

¥ 0

1 サーバー / 日 5 回
音声 20 分まで

無料で導入

PLUS

¥ 490 /月

回数無制限
音声 20 分まで
優先キュー & 高速化

PLUSを購入

PREMIUM

¥ 980 /月

回数無制限
音声 60 分まで
優先キュー & 高速化
プレミアムサポート

PREMIUMを購入

購入・質問は @pess_ham まで DM

よくある質問

文字起こしの精度は？

OpenAI Whisper を使用しており、日本語でも高精度です。環境音や早口の場合は若干の誤認識が発生します。

どのような音声ファイルに対応していますか？

mp3、wav、m4a、mp4、avi、mov など主要なフォーマットに対応しています。stand.fm の URL も直接貼り付けるだけで文字起こしできます。

文字起こしにはどのくらい時間がかかりますか？

音声の長さにもよりますが、通常 1-3 分程度で完了します。有料プランでは優先処理により更に高速化されます。

音声データのプライバシーは大丈夫ですか？

処理完了後、音声データは自動的に削除されます。文字起こし結果のみが一時的に保存され、外部への共有は一切行いません。

Botが反応しない場合はどうすればいいですか？

「もじ」とだけ送信するか、Botにメンションを付けて送信してください。それでも反応しない場合は一度Botを再招待してください。

無料版と有料版の違いは何ですか？

無料版は1日5回まで、音声20分までの制限があります。有料版では回数無制限、PREMIUM プランでは音声60分まで対応し、優先処理で高速化されます。