1
/
の
1
thunder出版
aizuchi-dataset-part4
aizuchi-dataset-part4
通常価格
¥8,500 JPY
通常価格
セール価格
¥8,500 JPY
税込。
100個の在庫
AiZuchi Part 4 — 日本語雑談音声コーパス(CD)
AiZuchi Part 4は、2人のネイティブスピーカーによる自然な日本語の雑談を収録した音声コーパスのCDです。台本なし・演技なし——素のままの会話をそのまま記録したプリミティブなデータセットです。
📀 収録内容
- 2人の話者による雑談音声(FLAC形式)
- 話者ごとに分離された個別コーパス(Speaker A / Speaker B)
- ステレオミックス音声
- タイムスタンプ付き書き起こし(JSONL形式)
- 話者メタデータ
🎙️ データの特徴
- プリミティブな生データ — 加工・編集を最小限に抑えた、素の雑談そのもの
- 話者別分離済み — 各話者の音声が独立したコーパスとして提供されるため、即座にモデル学習に利用可能
- 完全な許諾 — 全話者から商用利用を含む明示的な同意を取得済み
- 物理メディア — CDでの納品。オフライン環境でも安心してご利用いただけます
📋 技術仕様
- フォーマット: FLAC(ロスレス)
- サンプルレート: 16 kHz / 16bit
- 話者数: 2名
- 言語: 日本語(ネイティブスピーカー)
- メディア: CD
✅ ライセンス — ご購入で取得できる権利
- ASR・TTS・対話モデル等、あらゆる機械学習モデルの学習に利用可能
- 商用プロダクト・サービスへの組み込みOK
- 基盤モデルのファインチューニングに利用可能
- 学術研究・論文発表への利用OK
※ 生データの第三者への再配布・データセット自体の再販は禁止です。学習済みモデルの配布は自由です。
AiZuchi Part 1 — Japanese Casual Conversation Speech Corpus (CD)
AiZuchi Part 1 is a speech corpus CD containing natural, unscripted casual conversation (雑談) between two native Japanese speakers. No scripts, no acting — this is primitive, raw conversational data captured as-is.
📀 What's on the disc
- Casual conversation audio between 2 speakers (FLAC format)
- Per-speaker separated corpora (Speaker A / Speaker B)
- Stereo mix audio
- Time-aligned transcriptions (JSONL format)
- Speaker metadata
🎙️ Data characteristics
- Primitive raw data — Minimal processing. Authentic casual talk, recorded as-is
- Speaker-separated — Each speaker's audio is provided as an independent corpus, ready for immediate model training
- Fully licensed — Explicit consent obtained from all speakers, including commercial use
- Physical media — Delivered on CD. Accessible in offline environments
📋 Specifications
- Format: FLAC (lossless)
- Sample rate: 16 kHz / 16-bit
- Speakers: 2
- Language: Japanese (native speakers)
- Media: CD
✅ License — Rights you acquire with purchase
- Train any ML model — ASR, TTS, dialogue, voice cloning, etc.
- Deploy in commercial products and services
- Fine-tune foundation models (open or proprietary)
- Use for academic research and publication
※ Redistribution of raw data to third parties and resale of the dataset itself are prohibited. Models trained on this data may be freely distributed.
数量
受取状況を読み込めませんでした
