智能助手网
标签聚合 Gemini

/tag/Gemini

linux.do · 2026-04-18 19:39:02+08:00 · tech

电脑端我有Claude,Gemini和Perplexity,之前也用过GPT和Grok,算是都用过不少。 但手机端目前还没有靠谱方便的AI,求助一下… 手机端同步电脑的AI,每次要先开梯子、等连接,有时候场景又不方便,多端登还容易风控——总之不太方便。 目前手机上兜底用腾讯元宝,日常问点套餐资费、快递查询这类基础问题还凑合。但只要稍微有难度,就开始出问题——举个例子:做大物实验拍了照让它帮我处理数据、算重力加速度的不确定度,这种很基础的数据处理任务它都算不对。客观性和推理能力也差,很多话题直接指挥称赞。 所以想问问有没有什么好用的国产AI?kimi体验不错,但是听说付费效果也一般?MiniMax,Step,GLM怎么样?求助一下 btw: 需求就日常对话,简单问答,偶尔处理些数据,不要求什么代码,生成图片视频或者解决数学题超强,只是图个方便有用。 6 个帖子 - 6 位参与者 阅读完整话题

linux.do · 2026-04-18 02:00:21+08:00 · tech

介于opus4.7的注意力和gemini差不多只有100k左右的有效注意力,有点想换回opus4.6 1m在Claude code中使用。 就是不知道现在的opus4.6智商是否恢复了,有没有测试过的佬呢? 1. 9.9-9.11=? opus 4.6答错 opus4.7正确 2.洗车问题 “我想洗车,洗车店离我家 50 米,你觉得我应该走路还是开车去?” opus4.6和opus4.7都正确 opus4.6 opus4.7 3.红绿色盲问题 opus4.6错误 opus4.7正确 Claude code中测试,全部设置thinking effort为max,左边为4.7,右边为4.6 1. 9.9-9.11=? opus4.6依旧错误 2.洗车问题 全部正确 3.红绿色盲问题 opus4.6依旧错误,甚至思考了3分钟都错了!!! 总结:web端和claude code端,之前opus4.6能答对的现在正确率1/3,所以opus4.6 智力依旧没有恢复 opus4.7能全部答对,但是编程中有效上下文长度有限 由于llm是概率模型,并且web和cc中不能手动设置这些采样参数,所以每次出来的结果都有可能不一样受到各种采样参数的影响. web端测试均为开启thinking,关闭web search的情形下, Claude code中测试,全部设置thinking effort为max. 9 个帖子 - 6 位参与者 阅读完整话题

linux.do · 2026-04-17 14:49:51+08:00 · tech

Google – 16 Apr 26 New ways to create personalized images in the Gemini app Nano Banana 2 now uses your personal context and Google Photos to create images that reflect your unique life. [!quote]+ 您的许多重要时刻都保存在 Google 照片库中。通过将谷歌照片库与 “个人智能”(Personal Intelligence)技术相结合,双子座就能更进一步,而不仅仅是了解你的兴趣爱好。它可以使用你和你所爱的人的真实图像来指导图像生成过程。 有了这些标签,您只需要求双子座 “创建一个我和家人正在享受我们最喜欢的活动的粘土动画形象”,双子座就会自动为您生成特定的形象。您还可以尝试水彩画、炭笔素描或油画等不同风格。您可以将一个快速的想法变成一个定制的创作,省去了为了看到一个概念变成现实而搜索、下载和重新上传文件的麻烦。 1 个帖子 - 1 位参与者 阅读完整话题

linux.do · 2026-04-17 12:27:35+08:00 · tech

本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容: 我的帖子已经打上 开源推广 标签: 是 我的开源项目完整开源,无未开源部分: 是 我的开源项目已链接认可 LINUX DO 社区: 是 我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是 以上选择我承诺是永久有效的,接受社区和佬友监督: 是 以下为项目介绍正文内容,AI生成、润色内容已使用截图方式发出 作者最近都在一家小公司一个人做全栈开发,这期间有了不少新的思考和感悟,在这里写下来分享给大家。 正文 这阵子所有 AI 工具都在卷「帮你更快」------更快写代码、更快做方案、更快下判断。我反过来做了一个东西: 让你更慢 。 为什么?因为我越用 CC、Codex 这些工具,越有一个隐忧: 我的代码写得飞快,但我自己的判断力、品味、抽象能力反而在退化。 遇到问题我第一反应是「让 AI 试试」,而不是「我先想想」。长此以往,当所有人都拥有同样强的 AI 时,能分出高下的就是那些 没把思考外包出去的人 。 所以我做了 growth: https://github.com/zhu1090093659/growth 这是什么 一套 skill,装到你的AI工具箱里面。它不会替你写代码,只会在你准备写代码之前、之中、之后, 把你没想清楚的问题一层层剥出来 让你细细品味,获得真正的经验。 它只干一件事: 问问题 。 四个 skill Skill 什么时候用 它会问什么 taste-audit 代码/设计写完了,想知道写得好不好 这东西美不美?哪一行你其实不太想给别人看? intent-refine 有个想法但说不清,想定义需求 你到底要什么?为什么要?做完之后什么可观察的东西会不同? judgment-redteam 做了个决策,或倾向某个方案 你哪里可能是错的?一个比你聪明、不同意你的人会说什么? abstraction-uplift 代码 work 了但感觉结构不对 有没有东西被绑在一起但本不该绑?有没有抽象层其实是多余的? 真实交互示例 这段是测试 taste-audit 时的实际对话,能让你感受一下味道: 我 ❯ 帮我看看这段代码写得怎么样? [贴了一段 200 行的 Python 类] Claude ❯ 先不谈技术——你读这段代码的第一感觉是什么? 一个词形容。 我 ❯ 还行吧,能跑 Claude ❯ "还行"是真没感觉,还是感觉没想清楚? 你再读一遍,这 200 行里,有没有一行你其实不想让别人看到? 具体是第几行? 它不评价我的代码,它把我逼回到 我自己的感受 。而且它不接受"还行"这种含糊的退出------这是刻意设计的。 核心设计:三条铁律 每个 skill 开头都写着,AI 必须遵守: 1. 镜子原则 :禁止说"我觉得应该 XXX",只说"你觉得这里怎么样?" 2. 苏格拉底纪律 :只问问题不给答案,问题分三层锋利度(激活 → 刺破 → 重构) 3. 抗柔顺原则 : 用户感到舒适 = skill 失败。用户感到被挑战 = skill 成功。 第三条最反直觉也最关键。大部分 AI 工具的产品经理都在优化"用户满意度",但思考训练这件事,让你满意就意味着训练失效了。 跟 nuwa-skill 的区别 前阵子我看到有佬友分享过 nuwa-skill (蒸馏芒格、马斯克、Naval 的思维框架),我觉得那是个很棒的项目。growth 跟它正好是光谱的两端: nuwa-skill :蒸馏 别人 怎么想 → 让你拥有更好的顾问 growth :蒸馏 问题 本身 → 让你成为更好的自己 这是两种路线,客观的的说我觉得都挺好的,但是如果可以的话,我还是想让自己变得更好,嘿嘿。 顺便说一下这不适合谁? 如果你就是要 AI 快点帮你写完收工, 别装 ,会烦你。 如果你习惯"AI 夸我写得好我就开心", 别装 ,它不会夸你。 如果你需要的是标准答案而不是自己思考, 别装 ,它一个答案都不给。 适合谁: 对「AI 让我变废」这件事有警觉的人 做技术决策时想要一个主动挑刺的对手 想训练判断力/品味但不知道怎么练的人 版本说明 目前是 v0.1 公开实验 。问题库是我根据自己这段时间的经验攒的,还没经过大量实战验证。预计未来会基于反馈不断修改。 所以**如果你试用后有感受------不管是"这个问题正中我要害"还是"这个问题纯废话"------都欢迎来 issue 或 PR **。v0.2…v0.x 就靠大家的反馈演化。 链接 github.com GitHub - zhu1090093659/growth 通过在 GitHub 上创建帐户来为 zhu1090093659/growth 开发做出贡献。 最后一句也是 README 里写的: 如果 growth 让你的判断力变强了,记得别再依赖 growth,那就是毕业的时候。 训练轮终究是要扔掉的。 2026.04.17 随笔 4 个帖子 - 3 位参与者 阅读完整话题