esp32s3做了个AI拍照识别汉字

ID:57512 · 发表于 2026-3-1 04:57

本帖最后由太空将军于 2026-3-1 05:01 编辑

现在是夜里3点半，奶粉钱无着落，也头晕无聊，遂分享一下最近做的这个汉字识别尝试，硬件简单，微雪的esp32s3的2寸触摸屏，搭上arudino nano,摄像头ov2640插上就是，播音用的JQ8900TF,逻辑端都在nano上用arduinoIDE编写，nano控制语音模块，也接收esp发来的字符串判断处于什么界面，nano也发送学习内容到esp端显示，esp32端是LVGL显示，年龄选择，学习模式或复习模式，96*96抓拍用OCR模型运行，识别到的汉字高于85%置信度的，就传给arduino，arduino检测到识别准确就喊小朋友加油或继续，检测到学习完毕或复习完毕就恭喜一下小朋友。实物图欣赏===粘贴图片失败==附件了===

=================================分割================
其实我更想唠叨点非技术的，技术是个无底洞，我也是东戳戳西看看，没找到方向。这是我从25年底到26年的第三个单，第一个单得到80块：没有硬件，给stm32写一个ADC采集并波形显示，再串口发送到电脑即可，大概调了三五天。第二单得到150块，也是没硬件，是读取MPU6050的步数和XYZ加速度显示到3寸TFT上，这两单大概改了十几版，半夜发过去，第二天对方能运行就行了。第三单识字系统折腾够呛，我想着识字用百度的paddleOCR吧，试了一下电脑端Onnx识别率85%以上，就开始量化，结果连着几天量化INT8都失败，因为层级误差和图级误差爆炸，想着先INT16先跑起来再说，不管它模型有多大了(4M太大了)，然后部署还遇到esp32dl官方似乎有bug，改了官方代码后总算跑起来了呢又OCR识别需要几十秒，转而用edge平台来训练，于是用不同字体生成18000张训练图，edge平台上模型选用MobileNetV2 96x96 0.35，训练了50个字，INT8模型识别率达到99.1%，把下载的C++库部署到esp32s3后，花了些时间调节图像预处理，置信度阈值85%时勉强可以准确识别到30多个字，模型394ms运行时间，拍摄到识别几乎无感，我知道识别率不高这是因为训练图集和我抓拍到的差距太大引起的，不过既然不是产品开发，就不用花精力较真了，也视频验收过了。希望明天几百块可以到账。写到这，我发现我又聊技术了。于是我点了一支烟，想了想这些年的折腾，半桶水提着走来走去，妻女的目光依然动人，而我还是一无是处，没有深耕某个产品，没有进入某个供需链，2026或许应该改变一下，选一条路深耕下去。怎么选我也一直在看，看新奇的产品，看哪些利润供需稳定些，但是目前还一无所获。但是，夜晚妻女熟睡的身影，又似乎给了我一切。
如果有大佬看到这，期待指条明路，谢谢！

ID:277550 · 发表于 2026-3-2 00:30

没有根、没有底，谈不上“深耕”哪方向——运气爆棚的除外

ID:57512 · 发表于 2026-3-2 18:04

devcang 发表于 2026-3-2 00:30
没有根、没有底，谈不上“深耕”哪方向——运气爆棚的除外

兄弟你今年会发大财

ID:277550 · 发表于 2026-3-2 18:11

太空将军发表于 2026-3-2 18:04
兄弟你今年会发大财

顺利
[握手]

ID:512651 · 发表于 2026-3-4 15:14

可加我Q一下吗？我们有个项目要这这个功能，如果做肯定不是几百块的了
1600971300

帐号		自动登录	找回密码
密码			立即注册