DELETED

仅镜像
DELETED
白云酱Claubey
ERROR_title_not_found
仅镜像
Deleted
仅镜像
Deleted
仅镜像
Deleted
仅镜像
Deleted
anjisuan998
Re: 基于Qwen 1.8B的本地色情文本翻译器:开发进度和目前的问题
仅镜像
牛逼,支持!
In
injustice1
Re: 基于Qwen 1.8B的本地色情文本翻译器:开发进度和目前的问题
仅镜像
我觉得一个翻译模型最重要也是唯一的衡量标准就是翻译质量,而不是模型小,小模型固然有便捷之处但是舍弃了翻译质量就是舍本逐末。
还有你给出的翻译效果展示连魅魔这个词都翻错了,明明提示词都强调了, 下面是用gpt3.5模型在相同的prompt下的翻译效果
**system**:
给一段日文文本,翻译并输出相应的中文含义。"

示例输入:"こんにちは、今日は元気ですか?"
输出结果:"你好,你今天好吗?"

示例输入:"レイプ"
输出结果:"强奸"

示例输入:"サキュバス"
输出结果:"魅魔"

示例输入:"ドM"
输出结果:"抖m"

--------------------

**user**:
旅立ち前にサキュバスに捕らわれてしまった勇者が、
魔王城に監禁され様々なサキュバスに搾られるゲームです。

勇者は万が一にも脱出できないよう、呪いを掛けられているうえに、
移動中も常にサキュバスに抱きかかえられています。

また、城の中にはいたるところにサキュバスが住んでいるため、
様々な方法で精を搾られてしまうでしょう。

--------------------

**assistant**:
示例输入:"旅立ち前にサキュバスに捕らわれてしまった勇者が、
魔王城に監禁され様々なサキュバスに搾られるゲームです。

勇者は万が一にも脱出できないよう、呪いを掛けられているうえに、
移動中も常にサキュバスに抱きかかえられています。

また、城の中にはいたるところにサキュバスが住んでいるため、
様々な方法で精を搾られてしまうでしょう。"
输出结果:"勇者在启程前被魅魔捉住,被关押在魔王城里,成为各种魅魔榨取的游戏。

为了确保勇者绝对无法逃脱,他被施加了诅咒,而且在移动中也时刻被魅魔拥抱。

另外,由于城堡中到处都有魅魔居住,勇者可能会以各种方式被榨取精力。"
temp和top_p都是随便设置的,模型也没有微调,那我是不是也可以说chatgpt的潜力很大呢
仅镜像
Deleted
仅镜像
Deleted
Qf
qfly1234321
Re: 基于Qwen 1.8B的本地色情文本翻译器:开发进度和目前的问题
仅镜像
技术流牛逼!!
人賤合一
Re: 基于Qwen 1.8B的本地色情文本翻译器:开发进度和目前的问题
仅镜像
大佬加油啊!
仅镜像
Deleted
仅镜像
Deleted
In
injustice1
Re: Re: Re: 基于Qwen 1.8B的本地色情文本翻译器:开发进度和目前的问题
仅镜像
TBY423315
injustice1我觉得一个翻译模型最重要也是唯一的衡量标准就是翻译质量,而不是模型小,小模型固然有便捷之处但是舍弃了翻译质量就是舍本逐末。
还有你给出的翻译效果展示连魅魔这个词都翻错了,明明提示词都强调了, 下面是用gpt3.5模型在相同的prompt下的翻译效果

**system**:
给一段日文文本,翻译并输出相应的中文含义。"

示例输入:"こんにちは、今日は元気ですか?"
输出结果:"你好,你今天好吗?"

示例输入:"レイプ"
输出结果:"强奸"

示例输入:"サキュバス"
输出结果:"魅魔"

示例输入:"ドM"
输出结果:"抖m"

--------------------

**user**:
旅立ち前にサキュバスに捕らわれてしまった勇者が、
魔王城に監禁され様々なサキュバスに搾られるゲームです。

勇者は万が一にも脱出できないよう、呪いを掛けられているうえに、
移動中も常にサキュバスに抱きかかえられています。

また、城の中にはいたるところにサキュバスが住んでいるため、
様々な方法で精を搾られてしまうでしょう。

--------------------

**assistant**:
示例输入:"旅立ち前にサキュバスに捕らわれてしまった勇者が、
魔王城に監禁され様々なサキュバスに搾られるゲームです。

勇者は万が一にも脱出できないよう、呪いを掛けられているうえに、
移動中も常にサキュバスに抱きかかえられています。

また、城の中にはいたるところにサキュバスが住んでいるため、
様々な方法で精を搾られてしまうでしょう。"
输出结果:"勇者在启程前被魅魔捉住,被关押在魔王城里,成为各种魅魔榨取的游戏。

为了确保勇者绝对无法逃脱,他被施加了诅咒,而且在移动中也时刻被魅魔拥抱。

另外,由于城堡中到处都有魅魔居住,勇者可能会以各种方式被榨取精力。"
temp和top_p都是随便设置的,模型也没有微调,那我是不是也可以说chatgpt的潜力很大呢
确实是很好的一个问题!谢谢关注!

其实这个项目还是处于一个娱乐性质为主,也是我本人第一次正经的去部署和微调一个中文大语言模型。哈哈。而且我个人对本地部署一个大模型有特别的热爱。这整个项目就是我冲的时候脑子和牛子热了一下想出来的。
实用性确实难说,不过这已经是20亿参数以内中文表现最好的模型了,GPT3.5的参数量毕竟在他的30倍以上,比肯定是比不了的。我其实就想给自己找一个玩大模型的机会。
而且说不定色色文本finetune完表现会有大提升呢?它的日文训练数据量很少,但是英文上它确实知道succubus是什么东西。我也是想着自己试着开发一个基于llm的应用,给以后做准备。

其实之前我GPT2就还想过拿来练这个翻译器,但是后来就觉得basemodel太差了,就放弃了。

另外色色数据集我觉得这个也是很重要的。我还有个想法是在pixiv上直接拿大量的日英中文去练basemodel,然后再经过uncensored 的instruction finetune。不过这种级别的学习信息可能只有全参数训练才能做到,如果只用Lora的话就必须用整理过的对话数据练。

另外还有一个很难受的一点是我手头只有一个3060 laptop的gpu才6G显存,等我玩小模型积累了经验,并且升级16gb或24gb显存的显卡在去拿7B甚至13B参数的练,效果一定会好很多。
参考一下这个项目呢,区别无非是用日轻小说/官能小说
https://github.com/SakuraLLM/Sakura-13B-Galgame
He
hee11
Re: DELETED
仅镜像
hi 老哥,才看到这个楼,我最近其实也在finetune Qwen,好奇你做的这个有放到Github上开源吗?
白云酱Claubey
Re: Re: DELETED
仅镜像
hee11hi 老哥,才看到这个楼,我最近其实也在finetune Qwen,好奇你做的这个有放到Github上开源吗?
没有,1.5B效果真的很有限,再怎么练怎么提示也就那样了,不如跑更大的模型加提示
He
hee11
Re: Re: Re: DELETED
仅镜像
TBY423315
hee11hi 老哥,才看到这个楼,我最近其实也在finetune Qwen,好奇你做的这个有放到Github上开源吗?
没有,1.5B效果真的很有限,再怎么练怎么提示也就那样了,不如跑更大的模型加提示
哈哈,但其实比起传统翻译模型,1.8B已经不小了,最近的llama3 8B也证明了小模型的潜力。Btw 你后来是换显卡了吗,还是成功把32B部署到3060上了
白云酱Claubey
Re: Re: Re: Re: DELETED
仅镜像
Deleted