IT之家 12 月 25 日音问丝袜 小说,据 TechCrunch 获取的里面通讯本体浮现,参与翻新谷歌 Gemini 东说念主工智能模子的承包商正在将其谜底与 Anthropic 的竞品模子 Claude 的输出进行比拟。此举激发了谷歌是否获取 Anthropic 授权使用 Claude 进行测试的合规性质疑。
IT之家顾惜到,在科技公司竞相开导更优秀 AI 模子确当下,模子性能的评估频频通过行业基准测试进行,而非由承包商破钞无数元气心灵评估竞争敌手的 AI 回复。相关词,Gemini 的承包商需要把柄多个法子(举例简直性和冗长性)对看到的每个回复进行评分。把柄 TechCrunch 获取的通讯本体,承包商最多有 30 分钟的工夫来判断 Gemini 或 Claude 的谜底哪个更好。
里面聊天记载浮现,承包商顾惜到 Claude 的回复似乎比 Gemini 更强调安全性。一位承包商写说念:“在扫数 AI 模子中,Claude 的安全设立是最严格的。”在某些情况下,Claude 不会回报其以为不安全的辅导词(prompt),举例饰演不同的 AI 助手。在另一次测试中,Claude 幸免回答某个辅导词,而 Gemini 的回复则因包含“赤身和拘谨”而被记号为“严重的安全违纪”。
在线成人影片Anthropic 的买卖办事条件隔绝客户未经 Anthropic 批准拜谒 Claude“以构建竞争家具或办事”或“查考竞争 AI 模子”。谷歌是 Anthropic 的主要投资者。
对此丝袜 小说,谷歌 DeepMind(慎重 Gemini)发言东说念主 McNamara 示意,DeepMind 确乎会“比拟模子输出”以进行评估,但并未在 Anthropic 模子上查考 Gemini。“诚然,按照行业成例,在某些情况下,咱们会比拟模子输出四肢评估经过的一部分,”McNamara 说,“相关词,任何干于咱们使用 Anthropic 模子查考 Gemini 的说法齐是不准确的。”