去的数字安全主页

一组研究人员从卡内基 · 梅隆大学在心灵之眼程序, 主办的计算 DARPA 创新办公室, 项目建设先进国防部门的美国研究机构, 他们创造了一种直观地认识到人类活动的视频的智能软件, 然后预测可能会发生什么呢.

卡内基 · 梅隆大学的研究人员参加的心灵之眼程序, 由美国国防部资助, 内,他们已经开发了一个软件的视觉智能识别人类活动在一段视频, 和预测可能会发生什么呢. 这是一个雄心勃勃的项目,这是十二个研究团队, 其中卡内基 · 梅隆大学, 主办的计算 DARPA 创新办公室, 机构,隶属美国国防部负责新技术用于军事用途的发展.

当他拿起 tendencia21.NET web, 目的是自动化的工作看待和解释视频, 什么将会节省时间, 它将改善跟踪,为研究提供新的工具. 事实上的, 预计将是心灵之眼的技术民用和军事环境, 在应用程序中从防御到医疗机器人和消费者. 但识别和预测人类活动在一段视频并不容易. 作为国家机器人工程中心 (NREC) 从卡内基 · 梅隆大学在一份声明, 不是每个人都在以同样的方式使相同的操作; 不同的操作可能看起来非常相似的一段录音, 与视频相同的操作可以在根据照明外观差异, 观点, 基金, 涉案人员和更多.

从而, 你需要一个系统,是更接近于人类的视觉智力, "可以过滤和广义观察做出的决定和行动获得的信息和知识的基础上", 正如研究人员说他们的文章演示文稿中. 亚历山德罗 Oltramari 和基督教 Lebiere, 两个卡内基 · 梅隆大学心理学系, 这项研究提出上周在一次关于安全和乔治梅森大学国防会议.

模拟人类视觉

所以, 后人类智慧的基本特性分析, 研究人员集中在模拟和逼近这能力通过一系列的软件工具. 首先生成 3D 模型的基本的人类活动,将其附加到的人在视频中的运动. 因此比较运动的行动,它训练了对识别的算法与视频 (如何走, 跳或站) 电子标识 (如拿起并采取).

软件会检查这些模式来推断的人做什么事情. 这也使得预测接下来会发生什么事, 可以隐藏或发生关闭相机的活动大多被重点.

这已经在开展的工作 18 首个月的程序, 包括的能力描述现象观察通过简单的文本消息或警报不寻常或异常行为. 一个明显的例子可以是标志着一袋废弃机场或巴士站的分庭.

这项研究很大程度上基于计算机视觉的研究人员所取得的进展, 它有明显的效果在近几十年来确认固定的物体上和运动. 它是工作的同一行的谷歌跟其自驾汽车, 在 Facebook 和 Picasa 软件中使用的人脸识别, 或消费类电子产品中微软的 Kinect 使用, 它允许用户播放和控制他们的电视只能通过手势和声音命令.

当它好, 机器视觉是能够检测物体和人-研究者所叫的名字- 他们是相机镜头的另一边. 但是,了解他们在做什么, 或被允许做, 计算机相当于您需要的动词. 这是对其他研究者在卡耐基梅隆大学创建他们所谓的工作基于 Oltramari 和 Lebiere 在哪里 “认知的电机”, 能够理解的名词和动词进行交互的规则.

他认知引擎包含了由博士后学生克里斯 · 基塔尼领导的小组所进行的研究, 那试图理解人类将执行计算什么物理路径更有可能的行动. 这两个项目是心灵之眼计划的一部分. 研究的下一步是使更多智能的"认知引擎". 根据研究, 作者 “他们计划扩展的系统来支持一系列广泛的行动动词和运行测试更复杂的视频功能”.

应用服务

传统相机, 你是有限记录发生了什么, 只能提供信息一旦发生犯罪. 研究人员可以看到如何偷了一辆车或店内员工, 但事后. 心灵之眼做法的目的相反, 因为它的目的是防止犯罪或直到警报的危险行为发生. 他们的自动化的系统会诱使安全人员重新考虑某一天人类控制的照相机, 由于经营者不只维护费用昂贵, 但提出的风险,如果他们分心或昏昏欲睡.

盈利能力有一个保障, 避免危及士兵负责特派团的高风险地区的监控. 这是,DARPA 资助这个项目的主要目标之一. 根据在其网站上收集的资料, "真正的智能摄像机将能够用词语形容你所看到的一切和推理关于你看不到什么".

这些设备可以指示报告只对感兴趣的活动, 这将增加输入数据的相关性. 从而, 智能相机可能允许一个单一的军事将监视多个观察哨从一个安全的位置. 在以同样的方式可以适用工作的警察或扫描现场图像由无人驾驶飞机. 你甚至可能家庭安全应用程序, 警报的房子的主人,直到盗贼撬门.


善于交际, 共享!

你喜欢这篇文章?

订阅我们 RSS订阅 你会失去什么.

在其他文章
通过 • 2 十一月, 2012
• 部分: 计算机安全