**system**:temp和top_p都是随便设置的,模型也没有微调,那我是不是也可以说chatgpt的潜力很大呢
给一段日文文本,翻译并输出相应的中文含义。"
示例输入:"こんにちは、今日は元気ですか?"
输出结果:"你好,你今天好吗?"
示例输入:"レイプ"
输出结果:"强奸"
示例输入:"サキュバス"
输出结果:"魅魔"
示例输入:"ドM"
输出结果:"抖m"
--------------------
**user**:
旅立ち前にサキュバスに捕らわれてしまった勇者が、
魔王城に監禁され様々なサキュバスに搾られるゲームです。
勇者は万が一にも脱出できないよう、呪いを掛けられているうえに、
移動中も常にサキュバスに抱きかかえられています。
また、城の中にはいたるところにサキュバスが住んでいるため、
様々な方法で精を搾られてしまうでしょう。
--------------------
**assistant**:
示例输入:"旅立ち前にサキュバスに捕らわれてしまった勇者が、
魔王城に監禁され様々なサキュバスに搾られるゲームです。
勇者は万が一にも脱出できないよう、呪いを掛けられているうえに、
移動中も常にサキュバスに抱きかかえられています。
また、城の中にはいたるところにサキュバスが住んでいるため、
様々な方法で精を搾られてしまうでしょう。"
输出结果:"勇者在启程前被魅魔捉住,被关押在魔王城里,成为各种魅魔榨取的游戏。
为了确保勇者绝对无法逃脱,他被施加了诅咒,而且在移动中也时刻被魅魔拥抱。
另外,由于城堡中到处都有魅魔居住,勇者可能会以各种方式被榨取精力。"
TBY423315:↑参考一下这个项目呢,区别无非是用日轻小说/官能小说injustice1:↑我觉得一个翻译模型最重要也是唯一的衡量标准就是翻译质量,而不是模型小,小模型固然有便捷之处但是舍弃了翻译质量就是舍本逐末。确实是很好的一个问题!谢谢关注!
还有你给出的翻译效果展示连魅魔这个词都翻错了,明明提示词都强调了, 下面是用gpt3.5模型在相同的prompt下的翻译效果temp和top_p都是随便设置的,模型也没有微调,那我是不是也可以说chatgpt的潜力很大呢
**system**:
给一段日文文本,翻译并输出相应的中文含义。"
示例输入:"こんにちは、今日は元気ですか?"
输出结果:"你好,你今天好吗?"
示例输入:"レイプ"
输出结果:"强奸"
示例输入:"サキュバス"
输出结果:"魅魔"
示例输入:"ドM"
输出结果:"抖m"
--------------------
**user**:
旅立ち前にサキュバスに捕らわれてしまった勇者が、
魔王城に監禁され様々なサキュバスに搾られるゲームです。
勇者は万が一にも脱出できないよう、呪いを掛けられているうえに、
移動中も常にサキュバスに抱きかかえられています。
また、城の中にはいたるところにサキュバスが住んでいるため、
様々な方法で精を搾られてしまうでしょう。
--------------------
**assistant**:
示例输入:"旅立ち前にサキュバスに捕らわれてしまった勇者が、
魔王城に監禁され様々なサキュバスに搾られるゲームです。
勇者は万が一にも脱出できないよう、呪いを掛けられているうえに、
移動中も常にサキュバスに抱きかかえられています。
また、城の中にはいたるところにサキュバスが住んでいるため、
様々な方法で精を搾られてしまうでしょう。"
输出结果:"勇者在启程前被魅魔捉住,被关押在魔王城里,成为各种魅魔榨取的游戏。
为了确保勇者绝对无法逃脱,他被施加了诅咒,而且在移动中也时刻被魅魔拥抱。
另外,由于城堡中到处都有魅魔居住,勇者可能会以各种方式被榨取精力。"
其实这个项目还是处于一个娱乐性质为主,也是我本人第一次正经的去部署和微调一个中文大语言模型。哈哈。而且我个人对本地部署一个大模型有特别的热爱。这整个项目就是我冲的时候脑子和牛子热了一下想出来的。
实用性确实难说,不过这已经是20亿参数以内中文表现最好的模型了,GPT3.5的参数量毕竟在他的30倍以上,比肯定是比不了的。我其实就想给自己找一个玩大模型的机会。
而且说不定色色文本finetune完表现会有大提升呢?它的日文训练数据量很少,但是英文上它确实知道succubus是什么东西。我也是想着自己试着开发一个基于llm的应用,给以后做准备。
其实之前我GPT2就还想过拿来练这个翻译器,但是后来就觉得basemodel太差了,就放弃了。
另外色色数据集我觉得这个也是很重要的。我还有个想法是在pixiv上直接拿大量的日英中文去练basemodel,然后再经过uncensored 的instruction finetune。不过这种级别的学习信息可能只有全参数训练才能做到,如果只用Lora的话就必须用整理过的对话数据练。
另外还有一个很难受的一点是我手头只有一个3060 laptop的gpu才6G显存,等我玩小模型积累了经验,并且升级16gb或24gb显存的显卡在去拿7B甚至13B参数的练,效果一定会好很多。