找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索
查看: 1|回复: 0
收起左侧

esp32s3做了个AI拍照识别汉字

[复制链接]
ID:57512 发表于 2026-3-1 04:57 | 显示全部楼层 |阅读模式
本帖最后由 太空将军 于 2026-3-1 05:01 编辑

    现在是夜里3点半,奶粉钱无着落,也头晕无聊,遂分享一下最近做的这个汉字识别尝试,硬件简单,微雪的esp32s3的2寸触摸屏,搭上arudino nano,摄像头ov2640插上就是,播音用的JQ8900TF,逻辑端都在nano上用arduinoIDE编写,nano控制语音模块,也接收esp发来的字符串判断处于什么界面,nano也发送学习内容到esp端显示,esp32端是LVGL显示,年龄选择,学习模式或复习模式,96*96抓拍用OCR模型运行,识别到的汉字高于85%置信度的,就传给arduino,arduino检测到识别准确就喊小朋友加油或继续,检测到学习完毕或复习完毕就恭喜一下小朋友。实物图欣赏===粘贴图片失败==附件了===
92eebc70-5162-464c-8988-3433623e050b.png
=================================分割================
其实我更想唠叨点非技术的,技术是个无底洞,我也是东戳戳西看看,没找到方向。这是我从25年底到26年的第三个单,第一个单得到80块:没有硬件,给stm32写一个ADC采集并波形显示,再串口发送到电脑即可,大概调了三五天。第二单得到150块,也是没硬件,是读取MPU6050的步数和XYZ加速度显示到3寸TFT上,这两单大概改了十几版,半夜发过去,第二天对方能运行就行了。第三单识字系统折腾够呛,我想着识字用百度的paddleOCR吧,试了一下电脑端Onnx识别率85%以上,就开始量化,结果连着几天量化INT8都失败,因为层级误差和图级误差爆炸,想着先INT16先跑起来再说,不管它模型有多大了(4M太大了),然后部署还遇到esp32dl官方似乎有bug,改了官方代码后总算跑起来了呢又OCR识别需要几十秒,转而用edge平台来训练,于是用不同字体生成18000张训练图,edge平台上模型选用MobileNetV2 96x96 0.35,练了50个字,INT8模型识别率达到99.1%,把下载的C++库部署到esp32s3后,花了些时间调节图像预处理,置信度阈值85%时勉强可以准确识别到30多个字,模型394ms运行时间,拍摄到识别几乎无感,我知道识别率不高这是因为训练图集和我抓拍到的差距太大引起的,不过既然不是产品开发,就不用花精力较真了,也视频验收过了。希望明天几百块可以到账。写到这,我发现我又聊技术了。于是我点了一支烟,想了想这些年的折腾,半桶水提着走来走去,妻女的目光依然动人,而我还是一无是处,没有深耕某个产品,没有进入某个供需链,2026或许应该改变一下,选一条路深耕下去。怎么选我也一直在看,看新奇的产品,看哪些利润供需稳定些,但是目前还一无所获。但是,夜晚妻女熟睡的身影,又似乎给了我一切。
如果有大佬看到这,期待指条明路,谢谢!

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|51黑电子论坛 |51黑电子论坛6群 QQ 管理员QQ:125739409;技术交流QQ群281945664

Powered by 单片机教程网

快速回复 返回顶部 返回列表