Skip to content

日语的合成,几乎就是不能用的水平(来自一个听过预览后快笑死的人……) #29

@programus

Description

@programus

先允许我笑一阵子,哈哈哈哈……

看这个Blog,一开始觉得挺不错,后来手贱点了多语言支持,一看我也就日语能听懂,就再次手贱点了一下。结果,整个人都震惊了!

自认为也是听过中国各地方言版日语的,这么糟糕的还是第一次!这简直就不能称为日语了。尤其是其中 国内では、公共サービスの改善が進められ 这段,其中 国内 一词,直接中文发音就那么敢赤裸裸地混在一堆日语里冒出来了!这要是个日本人,估计直接风中凌乱了。然后最后一段 人々の生活の質向上が目指されています。以上、主なニュースでした。 更是直接摆烂,完全不知所云了。

一开始以为只是口音问题,后来才发现,完全就是个不懂日语的模型啊!

不知道你们日语的训练数据哪里来的,最终结果的检查又是什么人负责。这个水平的,实在太丢人了啊!罗马不是一天建成的,目前结果不好可以理解,但这种还拿出来展示就有点侮辱人了……

现在中日关系紧张了,你说,这要是一不小心这模型被用来制作对日策反之类的用处,岂不是威胁到国家安全?

你们要是实在缺人做日语的确认工作,工作量不大我可以兼职帮忙一下。工作量大也可以去外语学院之类的找人合作嘛。现在AI冲击翻译行业,估计他们正愁没活呢吧……

还有一个不需要太多人工的方法,把合成的语音喂给Gemini之类的,让它STT出来,然后比较前后的文字。当然,日语有汉字和假名的问题,可能完全不懂日语,文字比较也会比较费劲。

一句话,日语的TTS现在的水平,完全就是无法使用。其它小语种我不懂,就不好说了。
你们要想好好做多语言TTS,还是得重视起来。或者,咱就把中文和英文做好也行,别跟风宣传多语种支持。搞个其他我不会,中英我最强的模型,也不是不行嘛!

总之,我还是希望这个模型能做得更强更好的!
(我这issue不写英文,也是希望家丑尽量不外扬。)

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Type

    No type

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions