π¬ 3D-Speaker: A Large-Scale Multi-Device, Multi-Distance, and Multi-Dialect Corpus for Speech Representation Disentanglement
A large-scale speech corpus to facilitate the research of speech representation disentanglement.
3D-Speaker - ΡΡΠΎ Π½Π°Π±ΠΎΡ ΠΈΠ½ΡΡΡΡΠΌΠ΅Π½ΡΠΎΠ² Ρ ΠΎΡΠΊΡΡΡΡΠΌ ΠΈΡΡ
ΠΎΠ΄Π½ΡΠΌ ΠΊΠΎΠ΄ΠΎΠΌ ΠΈ ΠΊΡΡΠΏΠ½ΠΎΠΌΠ°ΡΡΡΠ°Π±Π½ΡΠΉ ΠΊΠΎΡΠΏΡΡ ΡΠ΅ΡΠΈ, Π΄Π»Ρ ΠΌΡΠ»ΡΡΠΈΠΌΠΎΠ΄Π°Π»ΡΠ½ΠΎΠΉ ΠΏΡΠΎΠ²Π΅ΡΠΊΠΈ Π΄ΠΈΠΊΡΠΎΡΠΎΠ², ΡΠ°ΡΠΏΠΎΠ·Π½Π°Π²Π°Π½ΠΈΡ Π΄ΠΈΠΊΡΠΎΡΠΎΠ² ΠΈ ΡΠ°Π·Π΄Π΅Π»Π΅Π½ΠΈΠ΅ Π΄ΠΈΠΊΡΠΎΡΠΎΠ².
3D-Speaker ΡΠΎΠ΄Π΅ΡΠΆΠΈΡ Π±ΠΎΠ»Π΅Π΅ 10 000 Π΄ΠΈΠΊΡΠΎΡΠΎΠ², ΠΊΠ°ΠΆΠ΄ΡΠΉ ΠΈΠ· ΠΊΠΎΡΠΎΡΡΡ
ΠΎΠ΄Π½ΠΎΠ²ΡΠ΅ΠΌΠ΅Π½Π½ΠΎ Π·Π°ΠΏΠΈΡΡΠ²Π°Π΅ΡΡΡ Π½Π΅ΡΠΊΠΎΠ»ΡΠΊΠΈΠΌΠΈ ΡΡΡΡΠΎΠΉΡΡΠ²Π°ΠΌΠΈ, ΡΠ°ΡΠΏΠΎΠ»ΠΎΠΆΠ΅Π½Π½ΡΠΌΠΈ Π½Π° ΡΠ°Π·Π½ΡΡ
ΡΠ°ΡΡΡΠΎΡΠ½ΠΈΡΡ
, Π° Π½Π΅ΠΊΠΎΡΠΎΡΡΠ΅ Π΄ΠΈΠΊΡΠΎΡΡ Π³ΠΎΠ²ΠΎΡΡΡ Π½Π° Π½Π΅ΡΠΊΠΎΠ»ΡΠΊΠΈΡ
Π΄ΠΈΠ°Π»Π΅ΠΊΡΠ°Ρ
.
π₯ Github: github.com/alibabaβ¦-Speaker
π Paper: https://arxiv.org/abs/2306.15354v1
πDataset: https://3dspeaker.github.io/
ai_machinelearning_big_data