2024-12
- 2024-12-13 Aguvis:提升的不仅是 UI Agent 的规划推理能力
- 2024-12-05 ShowUI:当前最好的 UI Agent 开源模型?
2024-11
- 2024-11-09 UI Agents(智能体)最新论文
- 2024-11-08 UI Agents(智能体)技术综述
2024-07
- 2024-07-25 LLaMA 3 掀桌子三部曲(二):LLaMA 3.1 发布
- 2024-07-06 多模态模型可以融合多少模态?Apple:≥ 21
- 2024-07-01 图像 Token 化:视觉数据转换的关键技术
2024-06
- 2024-06-25 别和 Scaling Laws 对抗
- 2024-06-19 Pix2Text V1.1.1 新版发布,带来更好的数学公式检测模型
2024-05
- 2024-05-08 Pix2Text V1.1 新版发布,支持 PDF 转 Markdown
2024-04
- 2024-04-19 LLaMA 3 掀桌子三部曲(一):LLaMA 3 发布
2024-02
- 2024-02-26 Pix2Text V1.0 新版发布,带来了最好的开源数学公式识别模型
- 2024-02-26 P2T详细资料
- 2024-02-26 P2T Detailed Infos
2023-12
- 2023-12-24 CnOCR V2.3 新版发布:模型更好、更多、更大
- 2023-12-08 更精准的硬币识别多模态模型:Coin-CLIP
2023-11
- 2023-11-17 OpenAI 如何优化 LLM 的效果
- 2023-11-08 非常有趣的一种OCR思路:EffOCR
2023-10
- 2023-10-12 基于大语言模型的AI Agents—Part 3
- 2023-10-01 CnOCR 纯数字识别新模型
2023-09
- 2023-09-04 Meta的版面恢复大模型:Nougat
- 2023-09-01 基于大语言模型的AI Agents—Part 2
2023-08
- 2023-08-29 解决超难问题的 Least-to-Most Prompt 框架
- 2023-08-22 基于大语言模型的AI Agents—Part 1
2023-07
- 2023-07-16 《机器学习&自然语言处理》课程解密了
- 2023-07-02 Pix2Text 新版公式识别模型
2023-06
- 2023-06-26 CnOCR
- 2023-06-25 比LLM更重要的多模态学习
- 2023-06-21 标注工具Label Studio如何导入本地文件和模型预测结果
- 2023-06-19 P2T YoloV7 数学公式检测模型开放购买
- 2023-06-16 本周日线下分享:《比LLM更重要的多模态学习》
- 2023-06-13 Pix2Text (P2T) 新版公式检测模型
- 2023-06-12 Buy Me Coffee
- 2023-06-09 知识星球
2023-03
- 2023-03-15 GPT-4 新的超能力
2023-02
- 2023-02-16 Contact Me
- 2023-02-12 About Me
2022-09
- 2022-09-08 CnOCR识别模型训练详细教程
2022-05
- 2022-05-06 FM 类模型
2021-05
- 2021-05-15 你真的读懂了Youtube DNN推荐论文吗?
2019-02
- 2019-02-23 Chatbot 8: 微软小冰对话机器人架构
2017-08
- 2017-08-07 Chatbot 7: 一种无监督的对话数据清洗方法
2016-09
- 2016-09-24 Chatbot 6: 对话交互时代的各种 Bot——可控性与智能性的权衡
- 2016-09-22 Chatbot 5: 创建Bot的中文平台——一个AI(yige.ai)
2012-10
- 2012-10-30 机器学习里需要知道的12堂课
2012-05
- 2012-05-07 也说说 EM
公告
🎉Pix2Text V1.1.1 新版发布🎉
-- 新版本特性 ---
V1.1.1 发布,带来全新的数学公式检测(MFD)模型