
2025年到2026年间,顶级AI公司接踵发布了一类居品:CLI形态的Agent器具。
Anthropic发布了ClaudeCode,一个在终局里开动的AI编程助手。OpenAI发布了CodexCLI,Google发布了GeminiCLI。这一波海浪中,实在每家值得随和的AI公司齐押注了呐喊行。
这很反直观。呐喊行是1970年代的产物,GUI的出现让估计机走入群众,当今出动互联网让触屏操作成为默许。按照常常的逻辑,时间的标的应该是越来越「可视化」、越来越「易用」。为什么在AI时间,最陈腐的交互风景反而卷土重来?
谜底不是心扉,是工程逻辑。
GUI对AI并不友好
GUI是为东说念主类视觉导航蓄意的。按钮、弹窗、拖拽、悬停成果——这些交互范式建筑在东说念主类的视觉直观上。东说念主类看一眼界面,扫描按钮位置,凭直观判断下一步操作。这套机制对东说念主类来说极其当然,实在不需要学习老本。
但LLM的使命相貌根蒂不是这么。LLM的输入是token,输出亦然token。它的「念念考」在话语空间里发生,而不是在像素空间里。
让AI操控GUI,意味着要逾越统统宏大的限制:
相识老本极高。AI需要借助估计机视觉或AccessibilityTree来「看懂」界面——哪个按钮可点、哪个输入框在那里、刻下弹窗是什么意思意思。这不是AI的强项,反而是特等背负。
气象隐式且不成探求。合并个按钮,今天可点,翌日可能因为某个要求变灰。这种隐式气象对东说念主类来说是「凹凸文」,对AI来说是不祥情味——它无法可靠地推理「这个操作在什么要求下可用」。
操作不成组合。莫得主义把两个GUI操作用管说念连起来。「搜索结果→过滤→导出」在GUI里是三次点击,莫得主义动作一个合座传递、复用或自动化。
难以测试和考据。AI奉行了一个GUI操作,若何阐发它顺利了?要截图、要理解界面气象,统统响应轮回又慢又脆。
比拟之下,CLI的每个特质齐像是专诚为AI蓄意的。
CLI对AIAgent的三大上风
可组合性
Unix形而上学的中枢是:「每个圭臬只作念一件事,并把它作念好;让圭臬大约协同使命」。
这个几十年前的蓄意原则,在AI时间精辟出新的道理。
对AIAgent来说,bg真人app官网下载可组合性意味着不错把多个呐喊流通成复杂的多次第使命流,每一步的输出齐是结构化的文本,不错被下一步铺张。莫得GUI的「点击→恭候→截图→理解」轮回,只好干净的输入输出。
可探求性
开云2026世界杯官方授权平台这对AI极其蹙迫。AI在推理一个器具时,需要建筑一个心智模子:这个器具的输入是什么,输出是什么,有什么反作用。GUI的隐式气象让这个心智模子充满不祥情味。CLI的显式参数让这个心智模子可靠而精准。
可审计性
通盘CLI操作齐是可记载的文本序列。AI奉行了什么呐喊、得到了什么输出,齐是东说念主类可读的文本。
这种透明性有两个克己。
对东说念主类:不错作念过后审查。你不错搜检AI开动了哪些呐喊、每步的输入输出是什么,统统推理链路一目了然。GUI操作的「点了什么」很难被追念,CLI操作的日记自然即是审计记载。
更宏不雅的趋势
ClaudeCode选拔优先发布CLI形态而不是IDE插件,这个决定背后有显明的工程逻辑:IDE插件受限于宿主环境,CLI器具不错在职何有终局的场所开动,不错被任何Agent调用,不错和任何其他器具组合。
这揭示了一个更根蒂的规章:AIAgent调用器具的实质,即是在奉行呐喊。器具调用(functioncall/tooluse)从语义上即是CLI——给命称呼和参数,复返结果。CLI器具自然即是Agent不错调用的函数,不需要任何转机层。
「TerminalasthenewIDE」这个说法早在AI兴起之前就有东说念主提过,但在AI时间它得到了全新的含义。不仅仅「在终局里写代码」,而是「Agent通过终局与全邦交互」。
昔日,CLI是时间东说念主员的专属器具。改日,CLI可能会成为Agent的通用话语——东说念主类通过当然话语和Agent对话,Agent通过CLI和系统交互。
小结
GUI的地位不会受到太大影响BG真人(BigGaming)官网,它仍然是东说念主类顺利操作估计机的最好界面。但当你的AI器具需要调用另一个器具时,CLI是最当然的桥梁,会有更多的软件为了稳妥Agent民俗推出更多的CLI器具。

备案号: