有米科技申请图像关键文本的提取方法及装置专利,提高图像中的关键文本的提
- 编辑:admin - 点击数:432有米科技申请图像关键文本的提取方法及装置专利,提高图像中的关键文本的提
金融界2024年11月4日消息,国家知识产权局信息显示,有米科技股份有限公司申请一项名为“一种图像关键文本的提取方法及装置”的专利,公开号CN118887649A,申请日期为2024年7月。

专利摘要显示,本发明涉及图像识别技术领域,公开了一种图像关键文本的提取方法及装置,该方法包括:将获取到的图像输入至预先训练好的文本检测模型,得到文本检测结果文本检测结果包括图像所包含的至少一个文本行对应的文本检测区域;根据文本检测结果,从图像中提取每个文本行对应的文字区域图像;从每个文本行对应的文字区域图像中提取该文本行对应的关键文字图像;关键文字图像包括满足确定出的颜色条件的关键文字区域;将每个关键文字图像输入至预先训练好的文本识别模型,得到图像对应的关键文本识别结果;关键文本识别结果包括图像所包含的关键文字信息。可见,实施本发明能够提高图像中的关键文本的提取准确性。
本文源自金融界