小米MIMO使用30天日志笔记

记录小米MIMO大模型使用过程中的发现、体验和思考

4月30日

重要发现

  1. 今天用小米MIMO最大的重要发现就是发现小米MIMO消耗的token呢,会比其他的模型哈,这地方对比的是Deepseek,当时是V3 R3吧?R3这个版本,会比它的消耗大出一个5倍左右。那是怎么发现的呢?就是因为星语凡尘里面有一个识别这个待办事项的一个功能。我发现它这个功能一直的加载不出来。然后呢,使用小米MIMO加ClaudeCode进行排查之后,就发现是因为窗口值最大的token消耗数是设的500,原来运行的呢也是示例的内容,原来呢从来没有超过500过,但小米上来呢,就干了2000多token。

小米MIMO token消耗对比

  1. 今天的第二个重要发现就是小米MIMO它好像没有视觉识别的功能。这个是怎么发现的哈?就是用它来做这个,用它来写这个专题前沿讲座的时候,那个大作业的时候,我是放了一些老师上课的PPT的图片在里面的,就是这些图片呢,包括这节课的标题和老师姓名。我就让告诉MIMO说,所有的课程都在里面了,让它挑几个课程就是来写。结果呢,发现它口头上答应了,并且也读取那个那个PNG格式图片了,但是它并没有真正识别出来图片里面是什么东西。这就是很大的问题。而且他没,他没有识别出来呢,他没有直接告诉我说他没有拥有一个读识图能力。他反而呢,是直接说,他反而是实,他反而是直接编造了一些课程的数据,说这是他根据那个图片来得出的一些东西。这一点我说不上是好是坏,好处呢可能就是在进行一些工程化的问题的时候,他确实能把这个工程完成。那么最后交付的结果也确实不是很,不算很差。他最后编的那些课程呢,实际上也是有一定相关性,跟这个行业的讲座。但是呢,坏处就是,它是一个黑箱,而且它欺骗了我。

流水账

  1. 今天呢使用小米MIMO主要做的一些事情就是把这个维权材料全权是由它来制作了一下,就是尤其是那个写了一十几个Word格式的一些诉讼的文件。不过我不知道是小米MIMO模型很强的原因,还是claude code它本来设计就很好。那小米MIMO呢是出乎意料,出色地完成了这个编造Word的任务。中间呢遇到了两个大的问题,首先第一个就是它创造了一个形式上的假的DOCX文件。只是二进制的那种文件,所以导致它打不开。第二一个大的错误呢,就是它把字体没有设置成宋体啊,这些常见字体,而设置成了日本的一款字体。不过后来我有问它为什么就是设置就是默认是一个日本字体。它说呢,是默认设置了一个东亚字体,而那个日本所代表那个字体呢,是一个典型的东亚的字体,所以说那个相当于是一个默认的字体。当然把这两那个问题解决之后呢,发现它的用这个就是处理Word的能力呢,就非常的强大了。尤其是沉淀到claude点MD这个文件之后。
  2. 今天还使用小米的MIMO模型加ClaudeCode这个来制作了一个小网站吧,算是。就是把那个有关的一些诉讼的所有材料做成了一个在线版本,并且能够输密码才能够查看。这一步呢,就大大地降低了一些沟通的门槛,就不需要我们很多时候传递信息就不需要通过网盘呀,通过微信加微信呀这种东西。因为发现现在的软件的门槛真的是在降低,任何人有任何想法,就是直接就走出一个软件出来。使用软件就是任何人制作一个软件呢,就像制作一个Word文档一一样简单。这是我对未来就是网页开发,就是软件行业的一个基础的认识。就是虽然非常精密的一些,比如说高并发的场景啊,或者是说需要设计数据库啊,设计架构一些场景呢,普通人肯定是做不到。但是呢,日常的很多很大一部分,我觉得超过一半部分的使用,人们都是可以像操作Word一样来制作一个网页的。

感受

  1. 使用小米MIMO模型呢,有一个很大的感受哈。当然这个跟小米MIMO模型本身没有什么关系,是关于AI的一些思考的感受。就是说普通人的维权成本大大降低了,如果你会用AI的话。原来呢,是你走到起诉啊这一步,实际上是非常困难的,因为你不懂一些法条,以及你没法去搜罗一些东西,你对这个东西没有一些基本概念,对这些法条,因为你没有对它有一个基本的框架的认识,所以你就导致不知道对面就是违反哪些法律。但现在有了AI之后呢,它能够精准地帮你定位它出问题的法条是哪一些,然后你自己去进行一个核实。这对于逻辑思维很强的人来说,就大大地降低了普通人维权的门槛。实际上很多事情呢,它并不是真正的诉讼一定要打赢就那个成功了。实际上你走到诉讼这一步,把起诉状这些东西材料全部提交之后呢,实际上对面就差不多就会和解了。所以说,AI呢,现在是让所有人都平等地能够走到起诉的这一步。实际上走到这一步呢,很多时候对面就已经开始怯场了,这时候呢,大概率就会和解了。

小米MIMO使用截图

  1. 今天的第二感受呢,其实不止针对于小米MIMO这一个模型,是针对于AI这一个大的概念的。也包括软件行业。我认为以后呢,信息传递的方式,还有软件的使用,它都不会再限制的这么死板了。以后呢,但凡有需求,就可以弄软件。软件呢,变得触手可得。就像刚才我说的,写软件就像写Word、写PPT一样,以后就是一个必备的技能。因为它真的很好的,可以很好的进行展示,很好的进行分享,这是办公软件所不能做到的效果。

5月1日

重要发现

  1. 小米的MIMO大模型系列呢,2.5全系列它是只支持文本推理的,不是一个多模态的模型。那多模态的模型它只有一个小米的MIMO V2,有一个o mini,这个模型它是支持视觉模型的。
  2. 小米的这个Token Plan它只支持以下模型。MiMo-V2.5-Pro、MiMo-V2.5、MiMo-V2.5-TTS-VoiceClone、MiMo-V2.5-TTS-VoiceDesign、MiMo-V2.5-TTS、MiMo-V2-Pro、MiMo-V2-Omni、MiMo-V2-TTS,那么一会在这里稍微总结一下,这些所有模型它分别是什么样的优势。

流水账

感受