Licensed Speech Corpus

AiZuchi

Japanese Casual Conversation Speech Corpus

日本語雑談音声コーパス「相槌」

Real conversations. Fully licensed.

AiZuchi is a Japanese casual conversation (雑談) speech dataset built from authentic two-person dialogues. Every recording is fully consented and cleared for commercial machine learning use — no legal gray areas, no attribution headaches.

Named after "相槌" — the Japanese art of responsive listening — this corpus captures the natural rhythm, backchannels, and spontaneous flow that make Japanese conversation unique. Each conversation is split into per-speaker corpora, giving you clean, separated audio tracks ready for model training.

Built for machine learning

🎙️

Per-Speaker Separation

Each conversation is split into individual speaker corpora. Clean, isolated audio channels for each participant.

📝

Full Transcription

Time-aligned transcripts with speaker IDs, turn indices, and conversation metadata in JSONL format.

🔒

Fully Licensed

All speakers have given explicit consent. Purchasers receive a commercial ML license with no usage restrictions on model training.

🗣️

Natural Casual Speech

Authentic 雑談 — fillers, backchannels, laughter, overlaps. Not scripted, not read-aloud. Real conversation.

Organized per conversation, per speaker

AiZuchi/ ├── README.md ├── LICENSE.md ├── metadata.jsonl # global metadata ├── conv_001/ │ ├── speaker_A/ │ │ ├── audio.flac # isolated channel │ │ └── transcript.jsonl │ ├── speaker_B/ │ │ ├── audio.flac │ │ └── transcript.jsonl │ └── mix.flac # combined stereo ├── conv_002/ │ └── ... └── speaker_info.json # demographics

Technical details

FORMATFLAC (lossless)
SAMPLE RATE16 kHz / 16-bit
SPEAKERS2 per conversation
LANGUAGEJapanese (native speakers)
STYLEUnscripted casual conversation (雑談)
ANNOTATIONSTranscription, timestamps, speaker ID, topic tags
CONSENTFull explicit consent from all participants

What you can do with AiZuchi

Commercial ML License

Train ASR, TTS, dialogue, and any speech/language model
Use in commercial products and services
Fine-tune foundation models (open or proprietary)
Use for academic research and publication
Internal R&D and prototyping
Redistribute the raw audio data to third parties
Resell or sublicense the dataset itself

Who is this for?

AiZuchi is designed for teams building Japanese speech and dialogue systems. Whether you're training an ASR engine that handles casual speech, building a conversational TTS voice, developing a spoken dialogue model, or researching backchannels and turn-taking in Japanese — this is clean, licensed data you can ship with.

Common questions

Can I use this data to train commercial models?
Yes. Your purchase grants you a full commercial machine learning license. You can train any model — ASR, TTS, dialogue, voice cloning, etc. — and deploy it in commercial products.
Is speaker consent documented?
Yes. All speakers provided explicit written consent for their recordings to be used in machine learning training, including commercial applications. Consent documentation is available upon request.
Can I redistribute the dataset?
No. The license covers usage for training and research, but you may not redistribute the raw data. Models trained on the data can be freely distributed.
What format are the transcriptions in?
JSONL with per-utterance entries containing: text, start/end timestamps, speaker ID, conversation ID, and turn index.

本物の雑談。完全な許諾。

AiZuchi(相槌)は、2人の話者による日本語の自然な雑談を収録した音声データセットです。すべての録音データは話者本人から明示的な許諾を取得しており、機械学習への商用利用がクリアされています。法的なグレーゾーンや帰属表示の煩雑さは一切ありません。

「相槌」——日本語の会話に特有の応答的傾聴の技法——を名前に冠した本コーパスは、日本語の雑談が持つ自然なリズム、あいづち、フィラー、自発的な発話の流れを忠実に捉えています。各会話は話者ごとのコーパスに分離されており、モデル学習にすぐに使用できるクリーンな音声トラックを提供します。

機械学習のために設計

🎙️

話者別分離

各会話は話者ごとのコーパスに分離。クリーンで独立した音声チャンネルを提供します。

📝

完全な書き起こし

タイムスタンプ付きの書き起こし、話者ID、ターンインデックス、会話メタデータをJSONL形式で提供。

🔒

完全な許諾

全話者から明示的な同意を取得済み。購入者は商用機械学習ライセンスを取得し、モデル学習に制限なく利用可能です。

🗣️

自然な雑談音声

本物の雑談——フィラー、あいづち、笑い声、発話の重なり。台本なし、朗読なし。リアルな会話そのものです。

会話ごと・話者ごとに整理

AiZuchi/ ├── README.md ├── LICENSE.md ├── metadata.jsonl # 全体メタデータ ├── conv_001/ │ ├── speaker_A/ │ │ ├── audio.flac # 分離チャンネル │ │ └── transcript.jsonl │ ├── speaker_B/ │ │ ├── audio.flac │ │ └── transcript.jsonl │ └── mix.flac # ステレオミックス ├── conv_002/ │ └── ... └── speaker_info.json # 話者属性情報

技術仕様

フォーマットFLAC(ロスレス)
サンプルレート16 kHz / 16bit
話者数1会話あたり2名
言語日本語(ネイティブスピーカー)
スタイル台本なし自然雑談
アノテーション書き起こし、タイムスタンプ、話者ID、トピックタグ
許諾全参加者から明示的同意取得済み

AiZuchiで可能なこと

商用機械学習ライセンス

ASR・TTS・対話モデル等、あらゆる音声/言語モデルの学習に利用可能
商用プロダクト・サービスへの組み込みOK
基盤モデル(オープン/プロプライエタリ)のファインチューニングに利用可能
学術研究・論文発表への利用OK
社内R&D・プロトタイピングに利用可能
生の音声データを第三者に再配布すること
データセット自体の再販・サブライセンス

どのような方に最適か

AiZuchiは、日本語の音声・対話システムを構築するチームのために設計されています。カジュアルな発話に対応するASRエンジンの学習、会話型TTSボイスの構築、対話言語モデルの開発、日本語のあいづちやターンテイキングの研究——いずれの用途でも、このデータセットはクリーンで許諾済みの、プロダクションに使えるデータを提供します。

FAQ

商用モデルの学習に使えますか?
はい。ご購入により商用機械学習ライセンスが付与されます。ASR、TTS、対話モデル、音声クローン等あらゆるモデルの学習に利用でき、商用プロダクトへのデプロイも可能です。
話者の同意は文書化されていますか?
はい。全話者から機械学習への利用(商用含む)について明示的な書面同意を取得しています。同意書類はご要望に応じて開示可能です。
データセットを再配布できますか?
いいえ。ライセンスは学習・研究目的での使用を許可しますが、生データの再配布はできません。本データで学習したモデルの配布は自由です。
書き起こしのフォーマットは?
JSONL形式で、各発話エントリにテキスト、開始/終了タイムスタンプ、話者ID、会話ID、ターンインデックスを含みます。

Start building with real Japanese conversation

One purchase. Full commercial ML rights. No recurring fees.