FifthOne:计算机视觉提示和技巧
发布日期:2021-05-27 02:53:20 浏览次数:29 分类:精选文章

本文共 2426 字,大约阅读时间需要 8 分钟。

FiftyOne 工具集:提升你的计算机视觉模型性能

FiftyOne 是一个开源机器学习工具集,专为数据科学团队设计,帮助他们轻松创建高质量数据集、评估模型、查找错误并可视化嵌入。无论你是数据科学家、研究员还是开发者,FiftyOne 都能为你提供强大的工具支持。


一、删除检测到不基数类的字段

在实际数据中,有时候会遇到某些字段明显有缺失或频率极低的类别。在处理时,如何高效删除这些低频率数据呢?

[代码示例]

import fiftyone as fo
import fiftyone.zoo as foz
# 加载数据集
dataset = foz.load_zoo_dataset("fiw", split="test")
# 统计字段出现频率
counts = dataset.count_values("name")
# 筛选出频率高于10的名称
keep_names = [name for name, count in counts.items() if count > 10]
# 按名称匹配保留的样本
view = dataset.match(
F("name").is_in(keep_names)
)
# 启动视图
session = fo.launch_app(view)

[/代码示例]


二、如何持久化数据集修改

在进行数据集修改后,如何确保你的更改能够持久保存?[代码示例]

# 在修改前,将数据集设为持久化模式
dataset.persistent = True
# 示例:修改第一个样本的类标签
sample = dataset.first()
sample.ground_truth.detections[0].label = "熊"
# 保存修改
sample.save()

[/代码示例]


三、处理齐次图像类标签预测

面对齐次类别图像(如全为猫或全为狗),如何实现有效的标注处理?[代码示例]

import numpy as np
import fiftyone as fo
import fiftyone.zoo as foz
from fiftyone import ViewField as F
# 创建或加载数据集
(dataset = fo.Dataset(...))
# 克隆预测结果到新字段
dataset.clone_sample_field(
"model_raw", "model_processed"
)
# 设定信心阈值
conf_thresh = 0.3
# 遍历所有样本
for sample in dataset.iter_samples(autosave=True):
dets = sample.model_processed.detections
labels = [det.label for det in dets]
unique_labels, label_counts = np.unique(labels, return_counts=True)
max_count = max(label_counts)
if max_count > 2:
# 获取最多的标签类别
crowd_label = unique_labels[np.argmax(label_counts)]
# 修改置信度较低的标签为目标类别
for det in dets:
if det.label != crowd_label:
if det.confidence < conf_thresh:
det.label = crowd_label
det.confidence = None
# 标记以便后续处理
sample.tags.append("可能的齐次集群")

[/代码示例]


四、批量处理数据集修改

如果需要对数据集中的每个样本进行批量修改,可以使用自动保存功能+[代码示例]

import random
import fiftyone as fo
import fiftyone.zoo as foz
# 加载数据集
dataset = foz.load_zoo_dataset("quickstart")
# 自动保存并批量处理
for sample in dataset.select_fields().iter_samples(autosave=True):
sample["random_field"] = random.random()

[/代码示例]


五、停止会话的方法

如何终止已经启动的FiftyOne会话?

在FiftyOne中,会话通过数据集或视图实例连接。当你想停止会话时,可以使用私有方法+[代码示例]

# 假设你已经引导用户启动会话
session = fo.launch_app(dataset)
# 退出会话
session.close()

[/代码示例]


六、加入FiftyOne 社区

FiftyOne 社区正在汇聚全球数千名计算机视觉工程师和数据科学家,为你的职业发展提供无限可能。

[社区亮点]

  • 成员人数:1,350+
  • GitHub星数:2,550+
  • 仓库数量:246+
  • 项目数目:56+

七、后续步骤

  • 如果你喜欢本文内容,请鼓励作者一杯咖啡。
  • FiftyOne 使启动并运行模型变得轻松。
  • 加入社区,我们乐意为你解答任何问题。

如果你对以上内容有任何疑问或建议,欢迎随时联系我们!

上一篇:ShellCode编写历程
下一篇:'转'test和cmp一个很菜很基础的话题! @ pediy.com

发表评论

最新留言

留言是一种美德,欢迎回访!
[***.207.175.100]2025年05月02日 21时10分38秒

关于作者

    喝酒易醉,品茶养心,人生如梦,品茶悟道,何以解忧?唯有杜康!
-- 愿君每日到此一游!

推荐文章

2023应届毕业生找不到工作很焦虑怎么办? 2023-01-24
2023最新版Node.js下载安装及环境配置教程(非常详细)从零基础入门到精通,看完这一篇就够了 2023-01-24
2023网络安全现状,一个(黑客)真实的收入 2023-01-24
2024 年需要了解的顶级大数据工具(非常详细)零基础入门到精通,收藏这一篇就够了 2023-01-24
2024 最新 Kali Linux 定制化魔改,完整版,添加常见60渗透工具,零基础入门到精通,收藏这篇就够了 2023-01-24
2024大模型行业应用十大典范案例集(非常详细)零基础入门到精通,收藏这一篇就够了 2023-01-24
00后才是内卷之王,被卷的头皮发麻.... 2023-01-24
2024届秋招让我(985本硕)直接破防,感觉书读了这么久结果毫无意义,读书就只为了读书,我该怎么办? 2023-01-24
2024年专业介绍||现代通信技术,从零基础到精通,收藏这篇就够了! 2023-01-24
2024年为什么越来越多的人选择转行网络安全?零基础入门到精通,收藏这篇就够了 2023-01-24
2024年从零学习AI和深度学习Transformer的路线图(非常详细)零基础入门到精通,收藏这一篇就够了 2023-01-24
006从零开始学Python—自定义函数 2023-01-24
2024年全球顶尖杀毒软件,从零基础到精通,收藏这篇就够了! 2023-01-24
2024年度“金智奖”揭晓:绿盟科技获双项大奖,创新驱动网络安全新高度。从零基础到精通,收藏这篇就够了! 2023-01-24
2024年最流行的十大开源渗透测试工具 2023-01-24
005从零开始学Python—字符串处理 2023-01-24
2024年网络安全八大前沿趋势,零基础入门到精通,收藏这篇就够了 2023-01-24
2024年薪酬最高的五个网络安全职位,零基础入门到精通,收藏这一篇就够 2023-01-24
2024年非科班的人合适转行做程序员吗? 2023-01-24
2024数字安全创新性案例报告,从零基础到精通,收藏这篇就够了! 2023-01-24