先允许我笑一阵子,哈哈哈哈……
看这个Blog,一开始觉得挺不错,后来手贱点了多语言支持,一看我也就日语能听懂,就再次手贱点了一下。结果,整个人都震惊了!
自认为也是听过中国各地方言版日语的,这么糟糕的还是第一次!这简直就不能称为日语了。尤其是其中 国内では、公共サービスの改善が進められ 这段,其中 国内 一词,直接中文发音就那么敢赤裸裸地混在一堆日语里冒出来了!这要是个日本人,估计直接风中凌乱了。然后最后一段 人々の生活の質向上が目指されています。以上、主なニュースでした。 更是直接摆烂,完全不知所云了。
一开始以为只是口音问题,后来才发现,完全就是个不懂日语的模型啊!
不知道你们日语的训练数据哪里来的,最终结果的检查又是什么人负责。这个水平的,实在太丢人了啊!罗马不是一天建成的,目前结果不好可以理解,但这种还拿出来展示就有点侮辱人了……
现在中日关系紧张了,你说,这要是一不小心这模型被用来制作对日策反之类的用处,岂不是威胁到国家安全?
你们要是实在缺人做日语的确认工作,工作量不大我可以兼职帮忙一下。工作量大也可以去外语学院之类的找人合作嘛。现在AI冲击翻译行业,估计他们正愁没活呢吧……
还有一个不需要太多人工的方法,把合成的语音喂给Gemini之类的,让它STT出来,然后比较前后的文字。当然,日语有汉字和假名的问题,可能完全不懂日语,文字比较也会比较费劲。
一句话,日语的TTS现在的水平,完全就是无法使用。其它小语种我不懂,就不好说了。
你们要想好好做多语言TTS,还是得重视起来。或者,咱就把中文和英文做好也行,别跟风宣传多语种支持。搞个其他我不会,中英我最强的模型,也不是不行嘛!
总之,我还是希望这个模型能做得更强更好的!
(我这issue不写英文,也是希望家丑尽量不外扬。)
先允许我笑一阵子,哈哈哈哈……
看这个Blog,一开始觉得挺不错,后来手贱点了多语言支持,一看我也就日语能听懂,就再次手贱点了一下。结果,整个人都震惊了!
自认为也是听过中国各地方言版日语的,这么糟糕的还是第一次!这简直就不能称为日语了。尤其是其中
国内では、公共サービスの改善が進められ这段,其中国内一词,直接中文发音就那么敢赤裸裸地混在一堆日语里冒出来了!这要是个日本人,估计直接风中凌乱了。然后最后一段人々の生活の質向上が目指されています。以上、主なニュースでした。更是直接摆烂,完全不知所云了。一开始以为只是口音问题,后来才发现,完全就是个不懂日语的模型啊!
不知道你们日语的训练数据哪里来的,最终结果的检查又是什么人负责。这个水平的,实在太丢人了啊!罗马不是一天建成的,目前结果不好可以理解,但这种还拿出来展示就有点侮辱人了……
现在中日关系紧张了,你说,这要是一不小心这模型被用来制作对日策反之类的用处,岂不是威胁到国家安全?
你们要是实在缺人做日语的确认工作,工作量不大我可以兼职帮忙一下。工作量大也可以去外语学院之类的找人合作嘛。现在AI冲击翻译行业,估计他们正愁没活呢吧……
还有一个不需要太多人工的方法,把合成的语音喂给Gemini之类的,让它STT出来,然后比较前后的文字。当然,日语有汉字和假名的问题,可能完全不懂日语,文字比较也会比较费劲。
一句话,日语的TTS现在的水平,完全就是无法使用。其它小语种我不懂,就不好说了。
你们要想好好做多语言TTS,还是得重视起来。或者,咱就把中文和英文做好也行,别跟风宣传多语种支持。搞个其他我不会,中英我最强的模型,也不是不行嘛!
总之,我还是希望这个模型能做得更强更好的!
(我这issue不写英文,也是希望家丑尽量不外扬。)