
FUTO Swipe:开源滑行输入模型挑战 Gboard,247 点 Hacker News 热议
FUTO 开源了 FUTO Swipe——一套完整的滑行输入(swipe typing)模型套件,包含编码器、解码器和小型语言模型,总参数仅 250 万,可在低端设备上毫秒级运行。在 Hacker News 上以 247 分引起热议,社区评价其准确率已匹敌 Gboard。
原文来源:FUTO Swipe — FUTO 开源滑行输入系统,包含三个轻量级模型和一个 C++ 推理库,专为离线隐私优先的移动键盘设计,总参数仅 250 万,准确率匹敌 Gboard。
2026 年 6 月,FUTO 正式发布了 FUTO Swipe——一套完整的开源滑行输入(swipe typing)系统。该项目在 Hacker News 上以 247 分 登上首页,标题就是简洁的「Show HN: FUTO Swipe – A new swipe typing model」。
一、为什么滑行输入需要开源?
移动端键盘的滑行输入功能长期以来被几个大厂垄断——Gboard(Google)、SwiftKey(Microsoft)——它们的滑行模型要么不开源,要么依赖云端数据。如果你想在一个隐私优先的应用中集成滑行输入,你的选择几乎为零。
FUTO 本身就是一家以隐私为核心的公司。它的 Android 键盘应用承诺 100% 离线、100% 私密——不联网、不传数据、不存储任何击键记录。但要在离线条件下实现高质量的滑行输入,必须自己训练模型。
结果是 FUTO Swipe——从数据收集到模型训练到推理库,全部开源。
—— 广告 ——
二、技术架构:三个模型的分层设计
FUTO Swipe 不是单个模型,而是一个三件套:
| 模型 | 参数量 | 作用 |
|---|---|---|
| Encoder | 635,140 | 布局无关 + 语言无关的通用编码器,处理滑行路径到候选词的初步映射 |
| ContextLM | 1,500,000(其中 110 万是嵌入层) | 极小型语言模型,利用前文词消除不合理候选,仅需文本数据即可训练 |
| Decoder | 304,155 | 语言相关 + 布局相关的解码器,学习特定布局的精确模式,实现最高准确率 |
活跃参数量:约 136 万 总参数量:约 250 万
这个体量意味着什么?作为对比,GPT-2 有 1.5 亿参数,LLaMA 最小的版本也有 70 亿。FUTO Swipe 的完整模型套件可以轻松塞进任何现代手机,甚至在低端设备上也只需几毫秒就能完成推理。
三、准确率表现
根据 FUTO 公布的基准测试:
- Top-4 失败率:约 4%
- 忽略 OOV(词表外单词):失败率低于 1%
- 使用 Beam Width = 300 进行词典约束搜索
FUTO 自己的声明是:「这些数字高度依赖于基准测试,实际使用可能会有所不同,但我们相信我们已经匹敌了大厂键盘。」
这并非空话。HN 评论区的用户反馈也印证了这一点:
"我用滑行打字在这个键盘上打了一段,它跟 Gboard 一样好。"
"FUTO Swipe 在准确率上的相对错误率改进 vs Gboard……简直让我抓狂——因为很长时间以来,太多移动键盘允许完全不合理的连词。"
四、数据从哪里来?
FUTO 在 2024 年 8 月启动了一个众包数据集收集项目。用户自愿访问 swipe.futo.org,在手机上按照提示滑行输入句子(主要来自 Wikipedia)。整个过程是透明且有明确说明的。
结果:
- 收集了 超过 100 万次滑行操作
- 筛选后于 2025 年 3 月以 MIT 许可 在 Hugging Face 上开源
- 从此不需要再依赖任何商业数据集
整个训练过程只需要 一块工作站 GPU——环境成本极低。
五、推理与集成
模型本身只是故事的一半。从滑行路径到单词预测,需要一套完整的推理流水线:
- 用户的手指在键盘上画出一条路径
- Encoder 将路径编码为特征
- 解码器 + 词典约束 Beam Search 找出最可能的候选词
- ContextLM 根据前文语境过滤不合理的候选项
FUTO 将这一切封装在一个 C++ 推理库 中,在 GitLab 上开源(GPL 许可),提供了从滑行路径到单词预测的完整管线。
开发者可以直接在 Android 应用、甚至 VR 环境或笔记本触控板中使用这套系统。
六、许可与使用
- 模型权重:FUTO Model License(要求给终端用户显示归属)
- 数据集:MIT 许可
- 推理库:GPL
- 桌面 Demo:swipe.futo.tech 提供了在线体验
七、意义与局限
开源滑行输入的意义:
- 打破了 Gboard/SwiftKey 对滑行输入的事实垄断
- 全套体系开源(数据→模型→推理库),任何人都可以复现和改进
- 极小的模型体积意味着它可以在任何设备上运行,包括 IoT 和低端手机
- 100% 离线运行,隐私上无可挑剔
需要注意的局限:
- 目前 Decoder 只支持 QWERTY 英语——其他布局和语言需要社区贡献数据
- ContextLM 仅通过文本数据训练,未来可以通过更多数据进一步优化
- FUTO Keyboard 本身是捐赠软件(一次性付费),但模型和推理库是开源可自由使用的
- iOS 版本不支持(FUTO 明确表示不会开发 iOS 版,因为 Apple 对第三方键盘的限制太严)
对于独立开发者来说,FUTO Swipe 提供了一个难得的机会:如果你想在应用中集成滑行输入,现在有了一个完全离线、隐私优先、开源的选择。而对于所有关心移动端隐私的用户来说,FUTO Keyboard + FUTO Swipe 已经是 Gboard 之外最值得尝试的替代方案。
© 2026 四月 · CC BY-NC-SA 4.0
原文链接:https://www.aprilzz.com/tools/futo-swipe-keyboard
相关文章
Open Design:开源 Claude Design 替代品,GitHub 60K+ Stars 的 Agent 原生设计工具
一个本地优先、开源、Agent 原生的设计工具。支持 150+ 设计系统、261+ 插件、21 种 Agent CLI,从原型到视频全覆盖。
TownSquare:一行 script 标签,让你的网站活起来
TownSquare 是一个极简的网站临场感工具,只需一行 script 标签,就能让访问者看到彼此、走动聊天、在页面上互动。单日引爆 HN,已注册 150+ 站点。
Codebase Memory MCP:158 种语言的代码知识图谱,毫秒级索引,99% 更少 Token
一个 C 语言编写的高性能 MCP 服务器,能在毫秒级内将整个代码库索引成知识图谱。Linux 内核(28M LOC)仅需 3 分钟完成全量索引,而 Cypher 查询不到 1 毫秒——AI Agent 无需逐文件搜索即可理解项目结构。