
FifthOne:计算机视觉提示和技巧
发布日期:2021-05-27 02:53:20
浏览次数:29
分类:精选文章
本文共 2426 字,大约阅读时间需要 8 分钟。
FiftyOne 工具集:提升你的计算机视觉模型性能
FiftyOne 是一个开源机器学习工具集,专为数据科学团队设计,帮助他们轻松创建高质量数据集、评估模型、查找错误并可视化嵌入。无论你是数据科学家、研究员还是开发者,FiftyOne 都能为你提供强大的工具支持。
一、删除检测到不基数类的字段
在实际数据中,有时候会遇到某些字段明显有缺失或频率极低的类别。在处理时,如何高效删除这些低频率数据呢?
[代码示例]
import fiftyone as foimport fiftyone.zoo as foz# 加载数据集dataset = foz.load_zoo_dataset("fiw", split="test")# 统计字段出现频率counts = dataset.count_values("name")# 筛选出频率高于10的名称keep_names = [name for name, count in counts.items() if count > 10]# 按名称匹配保留的样本view = dataset.match( F("name").is_in(keep_names))# 启动视图session = fo.launch_app(view)
[/代码示例]
二、如何持久化数据集修改
在进行数据集修改后,如何确保你的更改能够持久保存?[代码示例]
# 在修改前,将数据集设为持久化模式dataset.persistent = True# 示例:修改第一个样本的类标签sample = dataset.first()sample.ground_truth.detections[0].label = "熊"# 保存修改sample.save()
[/代码示例]
三、处理齐次图像类标签预测
面对齐次类别图像(如全为猫或全为狗),如何实现有效的标注处理?[代码示例]
import numpy as npimport fiftyone as foimport fiftyone.zoo as fozfrom fiftyone import ViewField as F# 创建或加载数据集(dataset = fo.Dataset(...))# 克隆预测结果到新字段dataset.clone_sample_field( "model_raw", "model_processed")# 设定信心阈值conf_thresh = 0.3# 遍历所有样本for sample in dataset.iter_samples(autosave=True): dets = sample.model_processed.detections labels = [det.label for det in dets] unique_labels, label_counts = np.unique(labels, return_counts=True) max_count = max(label_counts) if max_count > 2: # 获取最多的标签类别 crowd_label = unique_labels[np.argmax(label_counts)] # 修改置信度较低的标签为目标类别 for det in dets: if det.label != crowd_label: if det.confidence < conf_thresh: det.label = crowd_label det.confidence = None # 标记以便后续处理 sample.tags.append("可能的齐次集群")
[/代码示例]
四、批量处理数据集修改
如果需要对数据集中的每个样本进行批量修改,可以使用自动保存功能+[代码示例]
import randomimport fiftyone as foimport fiftyone.zoo as foz# 加载数据集dataset = foz.load_zoo_dataset("quickstart")# 自动保存并批量处理for sample in dataset.select_fields().iter_samples(autosave=True): sample["random_field"] = random.random()
[/代码示例]
五、停止会话的方法
如何终止已经启动的FiftyOne会话?
在FiftyOne中,会话通过数据集或视图实例连接。当你想停止会话时,可以使用私有方法+[代码示例]
# 假设你已经引导用户启动会话session = fo.launch_app(dataset)# 退出会话session.close()
[/代码示例]
六、加入FiftyOne 社区
FiftyOne 社区正在汇聚全球数千名计算机视觉工程师和数据科学家,为你的职业发展提供无限可能。
[社区亮点]
- 成员人数:1,350+
- GitHub星数:2,550+
- 仓库数量:246+
- 项目数目:56+
七、后续步骤
- 如果你喜欢本文内容,请鼓励作者一杯咖啡。
- FiftyOne 使启动并运行模型变得轻松。
- 加入社区,我们乐意为你解答任何问题。
如果你对以上内容有任何疑问或建议,欢迎随时联系我们!
发表评论
最新留言
留言是一种美德,欢迎回访!
[***.207.175.100]2025年05月02日 21时10分38秒
关于作者

喝酒易醉,品茶养心,人生如梦,品茶悟道,何以解忧?唯有杜康!
-- 愿君每日到此一游!
推荐文章
2023应届毕业生找不到工作很焦虑怎么办?
2023-01-24
2023网络安全现状,一个(黑客)真实的收入
2023-01-24
2024 年需要了解的顶级大数据工具(非常详细)零基础入门到精通,收藏这一篇就够了
2023-01-24
2024大模型行业应用十大典范案例集(非常详细)零基础入门到精通,收藏这一篇就够了
2023-01-24
00后才是内卷之王,被卷的头皮发麻....
2023-01-24
2024年专业介绍||现代通信技术,从零基础到精通,收藏这篇就够了!
2023-01-24
2024年为什么越来越多的人选择转行网络安全?零基础入门到精通,收藏这篇就够了
2023-01-24
006从零开始学Python—自定义函数
2023-01-24
2024年全球顶尖杀毒软件,从零基础到精通,收藏这篇就够了!
2023-01-24
2024年最流行的十大开源渗透测试工具
2023-01-24
005从零开始学Python—字符串处理
2023-01-24
2024年网络安全八大前沿趋势,零基础入门到精通,收藏这篇就够了
2023-01-24
2024年薪酬最高的五个网络安全职位,零基础入门到精通,收藏这一篇就够
2023-01-24
2024年非科班的人合适转行做程序员吗?
2023-01-24
2024数字安全创新性案例报告,从零基础到精通,收藏这篇就够了!
2023-01-24