type
Post
status
Published
date
Oct 18, 2025
slug
ai-practice
summary
至目前的AI实践阶段性总结与设想的未来落地需求
tags
开发
category
技术分享
titleIcon
password
icon
insider
🦯
至目前的AI实践阶段性总结与设想的未来落地需求

程序设计

  • 主用codex,cc(claude code),antigravity
notion image
notion image

中转配置

codex - zcf

  • codex - zcf按要求填入
notion image
  • 基础url - 填写站点url/v1
notion image

codex - config

  • 在配置文件自行写入
notion image

cc - ccr

  • ccr ui填写,url填写站点url/v1/messages
notion image
  • 选择模型与转换器,填写保存后需要右上角保存
notion image

二开项目

  • 可以在不深入了解相关技术栈的情况下快速进行二开,逐特性检验效果,迭代,尽可能保持新上下文,提示可能修改方向(如重叠UI,提示z-index)即可。

vicinae(C++ QT)

  • 图片预览
notion image
  • 多选,多个删除 多个复制 多个剪贴(可逆序) 内容预览中的复制
notion image

spectacle

  • 图片存储时返回file uri

科研积木

  • AI驱动的科研搭积木,对组合式创新枚举,作不同分支进行效果尝试,对表现最优的分支让AI包装模块讲故事(可结合对应md - gemini/agents/claude .md,提示重复要求 - 新配置为所有数据集添加)。
notion image
notion image

Vibe Coding

rosereader(electron)

  • 填补linux上找不到可以infinite scrolling的epub reader空白,加入一些阅读的统计信息,自选字体,间距,更符合个人审美的预设色彩搭配,划词跳转google ai mode解释,书签与高亮,自动监听文件系统变化识别新书。
notion image
notion image
notion image
  • 嵌套高亮与跳转提示
notion image
  • 类似code map的搜索提示
notion image
  • 书籍搜索
notion image
  • 划词跳转google ai mode释意
notion image
notion image

hanasato

  • 实现类似pinterest的瀑布流布局查看本地图片,用于选图与图片批量删除移动。
notion image
notion image
  • 文件夹访问历史与多标签页
notion image
notion image
  • gallery
notion image
notion image

基本学习

  • 给出需求场景获取方案
  • 需求:转发服务器(无代理环境)流量到本地(代理环境) → 方案:SSH转发
notion image
notion image

语言学习

二语习得

其他语言的提示词制作

  • 描述需要的元素(如词汇释义,语法解析,变形过程,拓展使用)与场景,贴上如下prompt 101文件,要求AI生成符合要求的提示词,可以达到结构化输出效果

工具使用 - notion

  • 善用kde spectacle的截取活动窗口,不需要选中任何区域一键截取,减少中断时间,但截取有一定延迟,尽量不选取快切换句子的时候截图,可以使用截取矩形区域兜底(需手动选择区域)。
  • 对已经熟悉但需要复习的,可以截图后批量反序粘贴(linux自行二开vicinae,win使用ditto)至notion。
  • 仅存取图片,类似用作anki卡片正面。
notion image

工具使用 - ai studio

  • 目前砍配额很严重,进一步使用需要cherry studio配合中转站,需支持视觉的模型调用。
  • 在右边system instructions填入prompt,往后只粘贴图片(可填写名字实现存储,但只存于浏览器本地)
notion image
notion image

工具使用 - cherry studio

  • 在助手处编辑,添加提示词
notion image
notion image

JP示例 - 日英释义

  • 参考提示词
  • 输入仅剪贴图片
notion image
  • 整体释义与假名注音汉字
notion image
  • 词汇释义 + 语法拆解 + 固定用语
notion image
  • 拓展练习
notion image
  • cherry studio案例
notion image
notion image
notion image
notion image

EN示例 - 英英释义

  • 参考提示词
  • 仅剪贴文本,此处在多文本中指明仅一处需释义
notion image
  • 固定用语
notion image
  • 替换
notion image
 

设想需求

视频内容识别 - Video Grounding

  • 找出视频包含XXX的某一帧
  • 自动定位ost中音乐在番剧的集数与时间

游戏mod研发Agent

  • RimWorld Mod研发Agent - 主要在于如何实现两点:1.需要反编译得到mods(二开)与游戏代码上下文,xml(配置文件)上下文 2.对相关上下文(数十万与百万行代码库)建索引

AI白噪音音乐

  • 添加环境背景音于指定音乐

带正面反馈/更细粒度/更灵活的推荐系统

  • 仅从用户使用的角度出发,很诡异的一点是推荐系统,从B站,知乎,小红书到Reddit,Youtube都不存在直接正面的反馈模式,只有负面,正面反馈都只依赖于固定模式的反馈,如点赞,收藏,喜欢等,但1.点赞,收藏,喜欢等都不应直接等同于正反馈 2.不存在直接正面反馈以挑选心仪内容,调整推荐优先级等的选项,如果三种交互都不做呢?
  • 收藏≠喜欢,收藏可以作为一种不设上限的稍后再看使用,或者仅仅一种资源收藏使用,稍后再看的不等于喜欢的,囤积的资源也不等于常看的。
  • 点赞同样≠喜欢,比如看了一个深度学习入门的组会汇报,点赞,可以是出于对创作者指标的贡献,视频质量的认可,不等于希望这样的内容更多地出现,“我最近看了深度学习入门教程”,“为这一入门教程点了赞”,完全可以是出于欣赏这一内容,作为教程而言很优秀的行为,不等于我需要更多相关的,不等于有“在学习深度学习“的用户画像,尤其是现有推荐系统往往颗粒度稀烂,会导致1.如果需要深度学习相关内容(推荐的内容与点赞体现的相同)的情形,会出现大量的入门教程,但入门教程只需要一个两个足以,总不能天天都在入门 2.如果不处于(推荐的内容与点赞体现的不同),用户也不能控制优先级,反馈的粒度(CV,NLP细分方向,实用教程与技术观点等)
  • 现有APP的推荐方式存在在单一方向倾向过大,欠缺多样的选择,比如知乎倾向于不同的内容,对于观点类内容,常推不同观点的回答,但回答之间的价值不是等同的,用户缺少选择,且负面反馈效果欠佳,不喜欢还推,且对于知识类(需要相似相关)的又不能保证内容的相关性了,小红书相反

租房合同AI

  • 通过对大量租房合同进行训练,使AI可以很好地应对租房中的经典qa
  • 识别合同中潜在的风险与成本转嫁的问题
  • 比如家具损坏责任认定,虚假的空调开销
  • 水电费不走民电民水
  • 打击房东在打工人与公司之间抽取过量利益的行为

将程序自动变成portable

  • portable在迁移设备时方便,可以直接磁盘拷贝即可完全复制程序状态,但现有情况下,存在(主要面向win) 1.使用了注册表的程序 2.数据目录定死在APPDATA等C盘目录下 等情形,实现一种AI将程序完全变成完全portable的,比如尝试将第二种里APPDATA的访问链接化,APPDATA链接到安装根目录文件夹下

视频理解时间戳自动截图与汇入内容

  • AI对传入的视频进行处理,能够截取出文字描述的对应时间戳,也能在对应时间戳按照格式(位置)等要求直接插入用户的添加内容

测试驱动开发 - 需求-测试用例/UT-代码实现-自动测试

  • 通过多Agent实现这样一套研发流程
  • 从结果出发,减少对AI的过程要求。通过I号Agent面向需求(包括产品产出的文档,UI产出的原型图,研发提出的性能指标与设计规格)设计对应的测试用例,通过II号Agent面向测试用例提供代码实现并要求通过测试用例,通过III号Agent面向实现代码进行Code Review并重测测试用例,通过IV号Agent实现自动化测试(比如Playwright等Web页面测试,相当于是最终用户与产品交互的测试)的开发流程。

MCP2APP - MCP代码转传统APP

  • MCP本身带有:吃RPM,吃Token,处理时间长,不便于中断等问题,对部分简单场景(如链接中Anki MCP场景)不适宜使用,成本高效果一般,相比下更适合作确定性的APP,可以实现一个AI Agent,专门用于在现有的MCP源码基础上构建一个确定的APP,将涉及AI(往往是数据转换与生成)的部分封装为一个RPC,结合到确定性的,不涉及AI的确定性业务流程中去。

AI逆向(bushi)

  • 只要逆向功底高,一切都是开源的

Context Learning

  • 在用户交互的上下文中实时学习

对抗现有学习经验的应用场景

  • 对抗现有LLM经验的需求Agent(面向药效训练的LLM添加盈利的维度,A方案药效更优,B方案有回扣,如何衡量,如何自行动态分层给低端一套高端一套)

监听Git Commit触发HF Space的factory rebuild

  • 对于HF Space多以Dockerfile的方式部署,没有像Vercel或Netlify上的新Commit触发部署更新,需要一个单独的APP实现,考虑上用Github Action在提交后Hook里进行HF Space的factory rebuild更新部署

带Prompt优化的基本交互工作流

  • 虽然对于如Gemini2.5Pro这样的优秀模型而言,直接简单的一句话已经可以解决相当部分任务,但实践上,仅通过简单将Google自家的Prompt Guide丢进去让AI对用户描述(简单一句话)生成对应的Prompt再去执行任务,效果表现仍有相当明显的提升,可以将这一流程作为一个基本的交互块
  • 下方案例里通过AI Studio用户输入,提供一个输入数据参考格式的例子和任务目标(通过MCP实现Anki自动制卡)
  • 生成对应Prompt,将其放入Cherry Studio的助手Prompt里,往后直接CV输入数据,然后自行制卡
notion image

元信息知识库

  • 让模型在对anki制卡时,自行提醒(想到)日语字体的问题
参考:
How to Fix the Japanese Font Issue on Anki/Chrome
The Japanese Font Issue or Chinese Font Issue is a problem for all Japanese learners on Windows computers where Japanese Kanji display using the default font this is Chinese Kanji. One of the first times learners will encounter this font problem is with the word 直る. 📋 Copy this Kanji and paste it into Anki to see which it looks like (Remember to preview the card as the UI and actual card may use different fonts): 直 The reason this issue is occurring is because 直 only has 1 unicode despite it looking different in Chinese and Japanese, unlike the following 3 kanji which use separate unicodes and can display differently: 乐樂楽 直 is not the only Kanji that is susceptible to this font issue and so it's best that all Japanese learners fix this before they get Chinese Kanji too engrained into their brains, which could lead to confusion later down the line. 🎬 Timestamps: 00:00 How to know if you have the font issue 00:54 Why the Japanese Font Issue exists 03:08 How to Fix the Font Issue (Method 1) 04:08 Method 2 04:40 Diagnosing Problems with Anki 05:32 Diagnosing Problems with Chrome ⭐Get Migaku ONE MONTH FREE⭐: → https://migaku.com/signup?code=Juls&legacy=true 👨‍👧‍👦 Our Public Discord Server: https://discord.gg/UaDRc9fR4U 🙇 Help me create future content by supporting me on Patreon! https://www.patreon.com/JouzuJuls 🎓 Book a Private 1-on-1 Class with Me: https://www.jouzujuls.com/classes Opening title credits: COEIROINK:AI声優-朱花 CV:AI声優-朱花@COEIROINK 声:AI声優-朱花@COEIROINK 🎵 Music Credits (tiny links to Google Docs): Most of the music comes from Epidemic Sound: https://epidemicsound.com/referral/x0q4r2 Other music comes from: https://bit.ly/JulsMusic
How to Fix the Japanese Font Issue on Anki/Chrome
  • 参见二语习得文章

启发式交互

  • 对于真正了解甚少的领域而言,用户是不能进行“提问“的,提问的前提是已经有一定的基础了解,至少知道该问什么,模型应该能实现一种树状的启发式的会话,用户给出某一个名词,模型逐步迭代从这个名词能延伸到的地方。

提前学习

  • 用于沉浸式学习方案,在观看视频前提前进行学习:
    • 抽取视频文本
    • 拆句(词汇/俚语/语法与固定(习惯)搭配/动词变形/游戏限定剧情上下文)
    • 制卡(理想情况应该能把片段拆下来)
  • 难点在于拆句的粒度 | 如何同时将片段也对应拆下来
notion image
 
MetingJS使用自定义音乐源-CF+Huggingface部署[2026.1.13]Karing施法指北
Loading...
2024-2026CamelliaV.

CamelliaV | Java;前端;AI;ACGN;