首页 / 全自主无人机飞行控制

全自主无人机飞行控制实质审查 发明

技术领域

[0003] 本公开内容的示例总体上涉及全自主无人机飞行。更特别地,但不作为限制,本公开内容提出了用于全自主无人机飞行的系统和方法,其中自主无人机仅接收初始飞行命令和在飞行计划结束时要降落于的对象或手的指示根据飞行计划飞行。

相关背景技术

[0004] 向用户提供摄影服务的自主无人机变得越来越受欢迎。但自主无人机设计被尺寸和功率约束限制。并且自主无人机的用户继续要求来自自主无人机的越来越多的服务。此外,自主无人机需要安全使用。

具体实施方式

[0023] 以下描述包括实施本公开内容的说明性示例的系统、方法、技术、指令序列和计算机程序产品。在以下描述中,出于说明的目的,阐述了许多具体细节,以便提供对本发明主题的各种示例的理解。然而,对于本领域技术人员将明显的是,可以在没有这些具体细节的情况下实践本发明主题的示例。通常,不一定详细示出公知的指令实例、协议、结构和技术。
[0024] 公开了用于全自主无人机飞行的系统、计算机可读介质和方法。远程控制装置通常难以使用,并且通常需要太长时间来使用以安全地控制无人机。此外,在一些环境下向自主无人机发送命令可能是困难的。例如,可能存在电磁干扰或使用类似波长的许多其他自主无人机。
[0025] 自主无人机710根据预定的预编程的飞行计划960执行全自主飞行。人通过使用自主无人机710的用户界面控件来控制自主无人机710,以指示自主无人机710执行全自主预编程的飞行计划960。例如,人可以选择对自主无人机710的控制旋钮614的设置,其选择预编程的飞行计划960,例如围绕人飞行和拍摄视频。然后,人选择飞行按钮806,其指示自主无人机710执行所选择的预编程的飞行计划960。自主无人机710捕获图像以确保飞行按钮806没有被意外按压,并且如果找到合适的初始面部,那么自主无人机710执行预编程的飞行计划960并返回至人。自主无人机710在人的前面悬停,并且当人将他们的手放置在自主无人机710下方时降落在人的手上。在一些示例中,自主无人机710在其飞行时进入较低电力状态641以节省能量。例如,无线连接666可以被关断,因为自主无人机710在其飞行时不需要接收指令或命令。根据一些实施方式,自主无人机710被称为个人自主无人机、无人机、半自主无人机或其他术语。
[0026] 联网计算环境
[0027] 图1是示出用于通过网络交换数据(例如,消息和相关联的内容)的示例消息收发系统100的框图。消息收发系统100包括客户端装置102的多个实例,所述实例中的每一个托管包括消息收发客户端104和其他应用106的多个应用。每个消息收发客户端104经由网络112(例如,因特网)通信地耦接至消息收发客户端104(例如,托管在相应的其他客户端装置
102上)的其他实例、消息收发服务器系统108和第三方服务器110。消息收发客户端104还可以使用应用程序接口(API)与本地主机应用106通信。
[0028] 消息收发客户端104能够经由网络112与其他消息收发客户端104以及与消息收发服务器系统108通信并交换数据。在消息收发客户端104之间以及在消息收发客户端104与消息收发服务器系统108之间交换的数据包括功能(例如,用于激活功能的命令)以及净荷数据(例如,文本、音频、视频或其他多媒体数据)。
[0029] 消息收发服务器系统108经由网络112向特定消息收发客户端104提供服务器侧功能。虽然消息收发系统100的某些功能在本文中被描述为由消息收发客户端104或由消息收发服务器系统108执行,但是某些功能是定位在消息收发客户端104内还是定位在消息收发服务器系统108内可以是设计选择。例如,在技术上可能优选的是:最初将某些技术和功能部署在消息收发服务器系统108内,但是后面将该技术和功能迁移至客户端装置102具有足够处理能力的消息收发客户端104。
[0030] 消息收发服务器系统108支持向消息收发客户端104提供的各种服务和操作。这样的操作包括向消息收发客户端104发送数据、从消息收发客户端104接收数据以及对由消息收发客户端104生成的数据进行处理。作为示例,该数据可以包括消息内容、客户端装置信息、地理定位信息、媒体增强和叠加(overlay)、消息内容持久化条件、社交网络信息和实况事件信息。通过经由消息收发客户端104的用户界面(UI)可用的功能来激活和控制消息收发系统100内的数据交换。
[0031] 现在具体地转至消息收发服务器系统108,应用程序接口(API)服务器116耦接至应用服务器114并且向应用服务器114提供编程接口。应用服务器114通信地耦接至数据库服务器120,该数据库服务器120促进对数据库126的访问,该数据库126存储与通过应用服务器114处理的消息相关联的数据。类似地,web服务器128耦接至应用服务器114,并且向应用服务器114提供基于web的接口。为此,web服务器128通过超文本传输协议(HTTP)和若干其他相关协议处理传入的网络请求。
[0032] 应用程序接口(API)服务器116在客户端装置102与应用服务器114之间接收和发送消息数据(例如,命令和消息净荷)。具体地,应用程序接口(API)服务器116提供一组接口(例如,例程和协议),该组接口可以由消息收发客户端104调用或查询以激活应用服务器114的功能。应用程序接口(API)服务器116显露由应用服务器114支持的各种功能,包括:账户注册;登录功能;经由应用服务器114将消息从特定消息收发客户端104发送至另一消息收发客户端104;将媒体文件(例如,图像或视频)从消息收发客户端104发送至消息收发服务器118并用于另一消息收发客户端104的可能访问;媒体数据集合(例如,故事)的设置;检索客户端装置102的用户的朋友列表;检索这样的集合;检索消息和内容;在实体图(例如,社交图)中添加和删除实体(例如,朋友);在社交图内定位朋友;以及打开应用事件(例如,与消息收发客户端104有关)。
[0033] 应用服务器114托管多个服务器应用和子系统,包括例如消息收发服务器118、图像处理服务器122以及社交网络服务器124。消息收发服务器118实现了多个消息处理技术和功能,特别是与从消息收发客户端104的多个实例接收到的消息中包括的内容(例如,文本和多媒体内容)的聚合和其他处理有关的消息处理技术和功能。如将更详细地描述的,来自多个源的文本和媒体内容可以被汇集成内容的集合(例如,被称为故事或图库(gallery))。然后,使这些集合对消息收发客户端104可用。鉴于对其他处理器和存储器密集型数据处理的硬件要求,也可以由消息收发服务器118在服务器侧执行其他处理器和存储器密集型数据处理。
[0034] 应用服务器114还包括图像处理服务器122,该图像处理服务器122专用于执行各种图像处理操作,通常相对于从消息收发服务器118发送或者在消息收发服务器118处接收的消息的净荷内的图像或视频,执行各种图像处理操作。
[0035] 社交网络服务器124支持各种社交联网功能和服务并使这些功能和服务可用于消息收发服务器118。为此,社交网络服务器124维护并访问数据库126内的实体图308(如图3所示)。社交网络服务器124所支持的功能和服务的示例包括识别消息收发系统100中的与特定用户具有关系或该特定用户正在“关注”的其他用户,以及识别特定用户的兴趣和其他实体。
[0036] 返回至消息收发客户端104,使外部资源(例如,应用106或小程序)的特征和功能经由消息收发客户端104的接口对用户可用。在该上下文中,“外部”是指应用106或小程序在消息收发客户端104外部的事实。外部资源通常由第三方提供,但是也可以由消息收发客户端104的创建者或提供者提供。消息收发客户端104接收对启动或访问这样的外部资源的特征的选项的用户选择。外部资源可以是安装在客户端装置102上的应用106(例如,“本地app”),或者是托管在客户端装置102上或远离客户端装置102(例如,在第三方服务器110上)的应用的小规模版本(例如,“小程序”)。应用的小规模版本包括应用(例如,应用的全规模、本地版本)的特征和功能的子集,并且使用标记语言文档来实现。在一个示例中,应用的小规模版本(例如,“小程序”)是应用的基于web的标记语言版本,并且被嵌入在消息收发客户端104中。除了使用标记语言文档(例如,.*ml文件)以外,小程序可以包括脚本语言(例如,.*js文件或.json文件)和样式表(例如,.*ss文件)。
[0037] 响应于接收到对启动或访问外部资源的特征的选项的用户选择,消息收发客户端104确定选择的外部资源是基于web的外部资源还是本地安装的应用106。在一些情况下,本地安装在客户端装置102上的应用106可以独立于消息收发客户端104并且与消息收发客户端104分开启动,例如通过在客户端装置102的主页画面上选择与应用106对应的图标。可以经由消息收发客户端104启动或访问这样的应用的小规模版本,并且在一些示例中,小规模应用的各部分都不能在消息收发客户端104之外被访问或者小规模应用的有限的部分可以在消息收发客户端104之外被访问。可以通过消息收发客户端104例如从第三方服务器110接收与小规模应用相关联的标记语言文档并处理这样的文档来启动小规模应用。
[0038] 响应于确定外部资源是本地安装的应用106,消息收发客户端104指示客户端装置102通过执行与外部资源对应的本地存储的代码来启动外部资源。响应于确定外部资源是基于web的资源,消息收发客户端104与第三方服务器110通信(例如)以获得与所选择的外部资源对应的标记语言文档。然后消息收发客户端104处理获得的标记语言文档以在消息收发客户端104的用户界面内呈现基于web的外部资源。
[0039] 消息收发客户端104可以向客户端装置102的用户或与这样的用户有关的其他用户(例如,“朋友”)通知一个或更多个外部资源中正发生的活动。例如,消息收发客户端104可以向消息收发客户端104中的对话(例如,聊天会话)中的参与者提供与用户组中的一个或更多个成员当前或最近使用外部资源有关的通知。可以邀请一个或更多个用户加入有效的外部资源或启动(在该朋友组中)最近使用但当前不活动的外部资源。外部资源可以向对话中的各自使用相应的消息收发客户端104的参与者提供与进入聊天会话中的用户组中的一个或更多个成员分享外部资源中的项、状况、状态或定位的能力。共享项可以是交互式聊天卡,聊天的成员可以利用该交互式聊天卡进行交互,例如,以启动对应的外部资源,观看外部资源内的特定信息,或将聊天的成员带到外部资源内的特定位置或状态。在给定的外部资源内,可以向消息收发客户端104上的用户发送响应消息。外部资源可以基于外部资源的当前上下文将不同的媒体项选择性地包括在响应中。
[0040] 消息收发客户端104可以向用户呈现可用外部资源(例如,应用106或小程序)的列表以启动或访问给定的外部资源。该列表可以以上下文相关菜单的方式呈现。例如,表示应用106(或小程序)的不同应用(或小程序)的图标可以基于用户如何启动菜单(例如,从对话界面或从非对话界面)而变化。
[0041] 系统架构
[0042] 图2是示出根据一些示例的关于消息收发系统100的另外的细节的框图。具体地,消息收发系统100被示为包括消息收发客户端104和应用服务器114。消息收发系统100包含多个子系统,这些子系统在客户端侧由消息收发客户端104支持并且在服务器端侧由应用服务器114支持。这些子系统包括例如短暂定时器系统202、集合管理系统204、增强系统208、地图系统210、游戏系统212、外部资源系统214和自主无人机管理系统216。
[0043] 短暂定时器系统202负责实施由消息收发客户端104和消息收发服务器118对内容的临时或时间受限访问。短暂定时器系统202包含多个定时器,这些定时器基于与消息或消息集合(例如,故事)相关联的持续时间和显示参数来选择性地实现经由消息收发客户端104访问(例如,用于呈现和显示)消息和相关联的内容。下面将提供关于短暂定时器系统
202的操作的其他细节。
[0044] 集合管理系统204负责管理媒体的集或集合(例如,文本、图像、视频和音频数据的集合)。内容(例如,消息,包括图像、视频、文本和音频)的集合可以被组织成“事件图库”或“事件故事”。可以使这样的集合在指定的时间段(例如内容所涉及的事件的持续时间)内可用。例如,可以使与音乐会有关的内容在音乐会的持续时间内作为“故事”可用。集合管理系统204还可以负责向消息收发客户端104的用户界面发布提供对存在特定集合的通知的图标。
[0045] 集合管理系统204还包括策展接口206,该策展接口206使得集合管理者能够管理和策展特定内容集合。例如,策展接口206使得事件组织者能够策展与特定事件相关的内容的集合(例如,删除不适当的内容或冗余消息)。另外,集合管理系统204采用机器视觉(或图像识别技术)和内容规则来自动地策展内容集合。在某些示例中,可以向用户支付补偿以用于将用户生成的内容包括到集合中。在这样的情况下,集合管理系统204进行操作以自动向这样的用户进行支付以使用其内容。
[0046] 增强系统208提供使得用户能够增强(例如,注解或以其他方式修改或编辑)与消息相关联的媒体内容的各种功能。例如,增强系统208提供与生成和发布用于由消息收发系统100处理的消息的媒体叠加(media overlay)有关的功能。增强系统208基于客户端装置102的地理定位可操作地向消息收发客户端104供应媒体叠加或增强(例如,图像过滤器)。
在另一示例中,增强系统208基于诸如客户端装置102的用户的社交网络信息的其他信息可操作地向消息收发客户端104供应媒体叠加。媒体叠加可以包括音频和视觉内容和视觉效果。音频和视觉内容的示例包括图片、文本、徽标、动画和声音效果。视觉效果的示例包括颜色叠加。音频和视觉内容或视觉效果可以应用于客户端装置102处的媒体内容项(例如,照片、数字对象)。例如,媒体叠加可以包括可以叠加在由客户端装置102拍摄的照片的顶部上的文本或图像。在另一示例中,媒体叠加包括位置标识叠加(例如,威尼斯海滩)、实况事件的名称或商家名称叠加(例如,海滩咖啡馆)。在另一示例中,增强系统208使用客户端装置
102的地理定位来识别包括客户端装置102的地理定位处的商家名称的媒体叠加。媒体叠加可以包括与商家相关联的其他标志。媒体叠加可以存储在数据库126中并通过数据库服务器120进行访问。
[0047] 在一些示例中,增强系统208提供基于用户的发布平台,该基于用户的发布平台使得用户能够选择地图上的地理定位,并且上传与选择的地理定位相关联的内容。用户也可以指定在什么情况下应向其他用户提供特定的媒体叠加。增强系统208生成包括所上传的内容并将所上传的内容与所选择的地理定位相关联的媒体叠加。
[0048] 在其他示例中,增强系统208提供基于商家的发布平台,该基于商家的发布平台使得商家能够经由出价(bidding)处理选择与地理定位相关联的特定媒体叠加。例如,增强系统208将最高出价商家的媒体叠加与对应地理定位相关联达预定义时间量。
[0049] 地图系统210提供各种地理定位功能并且支持由消息收发客户端104呈现基于地图的媒体内容和消息。例如,地图系统210使得能够在地图上显示用户图标或化身(例如,存储在简档数据316中的),以在地图的上下文中指示用户的“朋友”的当前定位或过去定位以及由这样的朋友生成的媒体内容(例如,包括照片和视频的消息的集合)。例如,在消息收发客户端104的地图界面上,可以将用户从特定地理定位发布到消息收发系统100的消息在地图的该特定定位的情境内显示给特定用户的“朋友”。用户还可以经由消息收发客户端104与消息收发系统100的其他用户(例如,使用适当的状况化身)分享他或她的定位和状况信息,其中,在消息收发客户端104的地图界面的上下文内该定位和状况信息被类似地显示给选择的用户。
[0050] 游戏系统212在消息收发客户端104的上下文内提供各种游戏功能。消息收发客户端104提供游戏界面,该游戏界面提供可用游戏的列表,该可用游戏可以在消息收发客户端104的上下文内由用户启动并与消息收发系统100的其他用户一起玩。消息收发系统100还使得特定用户能够通过从消息收发客户端104向这样的其他用户发出邀请来邀请其他用户参与特定游戏的玩法。消息收发客户端104还支持游戏过程的上下文内的语音和文本消息收发(例如,聊天)两者,提供关于游戏的排行榜,并且还支持提供游戏内奖励(例如,硬币和物品)。
[0051] 外部资源系统214为消息收发客户端104提供接口以与远程服务器(例如,第三方服务器110)通信以启动或访问外部资源(即,应用或小程序)。每个第三方服务器110托管例如基于标记语言(例如,HTML5)的应用或应用的小规模版本(例如,游戏应用、实用程序应用、支付应用或乘车共享应用)。消息收发客户端104可以通过从与基于web的资源相关联的第三方服务器110访问HTML5文件来启动基于web的资源(例如,应用)。在某些示例中,利用由消息收发服务器118提供的软件开发工具包(SDK)以JavaScript对由第三方服务器110托管的应用进行编程。SDK包括应用编程接口(API),这些API具有可以由基于web的应用调用或激活的功能。在某些示例中,消息收发服务器118包括JavaScript库,该JavaScript库提供对消息收发客户端104的某些用户数据的给定外部资源访问。HTML5被用作用于对游戏进行编程的示例技术,但是可以使用基于其他技术编程的应用和资源。
[0052] 为了将SDK的功能集成到基于web的资源中,SDK由第三方服务器110从消息收发服务器118下载,或者由第三方服务器110以其他方式接收。一旦被下载或接收,SDK就将被包括作为基于web的外部资源的应用代码的一部分。然后,基于web的资源的代码可以调用或激活SDK的某些功能以将消息收发客户端104的特征集成到基于web的资源内。
[0053] 存储在消息收发服务器118上的SDK有效地提供了外部资源(例如,应用106或小程序)与消息收发客户端104之间的桥接。这为用户提供了在消息收发客户端104上与其他用户通信的无缝体验,同时还保留了消息收发客户端104的外观和感觉。为了桥接外部资源与消息收发客户端104之间的通信,在某些示例中,SDK有助于第三方服务器110与消息收发客户端104之间的通信。在某些示例中,在客户端装置102上运行的WebViewJavaScriptBridge在外部资源与消息收发客户端104之间建立两个单向通信通道。在外部资源与消息收发客户端104之间经由这些通信通道异步地发送消息。每个SDK功能激活被作为消息和回调来发送。每个SDK功能通过构造唯一的回调标识符并发送具有该回调标识符的消息来实现。
[0054] 通过使用SDK,并非来自消息收发客户端104的所有信息都与第三方服务器110共享。SDK基于外部资源的需求来限制共享哪些信息。在某些示例中,每个第三方服务器110向消息收发服务器118提供对应于基于web的外部资源的HTML5文件。消息收发服务器118可以在消息收发客户端104中添加基于web的外部资源的视觉表示(例如,盒设计(box art)或其他图形)。一旦用户通过消息收发客户端104的GUI选择该视觉表示或指示消息收发客户端104来访问基于web的外部资源的特征,消息收发客户端104就获得HTML5文件并且使访问基于web的外部资源的特征所需的资源实例化。
[0055] 消息收发客户端104呈现用于外部资源的图形用户界面(例如,登录页面或标题画面)。在呈现登录页面或标题画面期间、之前或之后,消息收发客户端104确定所启动的外部资源是否先前已被授权访问消息收发客户端104的用户数据。响应于确定启动的外部资源先前已被授权访问消息收发客户端104的用户数据,消息收发客户端104呈现包括外部资源的功能和特征的外部资源的其他图形用户界面。响应于确定所启动的外部资源先前未被授权访问消息收发客户端104的用户数据,在显示外部资源的登录页面或标题画面的阈值时间段(例如,3秒)之后,消息收发客户端104滑动用于授权外部资源访问用户数据的菜单(例如,使菜单动画化为从画面底部浮现到画面的中间或其他部分)。该菜单标识外部资源将被授权进行使用的用户数据的类型。响应于接收到对接受选项的用户选择,消息收发客户端104将外部资源添加到授权的外部资源的列表中,并且使得外部资源能够访问来自消息收发客户端104的用户数据。在一些示例中,消息收发客户端104根据OAuth 2框架来授权外部资源访问用户数据。
[0056] 消息收发客户端104基于被授权的外部资源的类型来控制与外部资源共享的用户数据的类型。例如,包括全规模的应用(例如,应用106)的外部资源被提供有对第一类型的用户数据(例如,具有或不具有不同化身特性的用户的仅二维化身)的访问权。作为另一示例,向包括应用的小规模版本(例如,应用的基于web的版本)的外部资源提供对第二类型的用户数据(例如,支付信息、用户的二维化身、用户的三维化身、以及具有各种化身特性的化身)的访问。化身特性包括定制化身的外观和感觉(例如不同的姿势、面部特征、服装等)的不同方式。
[0057] 自主无人机管理系统216提供用于管理诸如图7、图8、图11和图12的自主无人机710的自主无人机的功能和例程。在一些示例中,控制应用存在于诸如客户端装置102、场外客户端装置704、服务器706、智能手机708的主机装置中。例如,控制应用使得用户能够设置阈值、用于控制旋钮614的飞行计划和其他偏好。在一些示例中,自主无人机管理系统216提供辅助控制应用的功能和例程。
[0058] 数据架构
[0059] 图3是示出根据某些示例的可以存储在消息收发服务器系统108的数据库126中的数据结构300的示意图。虽然数据库126的内容被示为包括多个表,但是应当理解,数据可以存储在其他类型的数据结构中(例如,作为面向对象的数据库)。
[0060] 数据库126包括存储在消息表302中的消息数据。对于任何特定的消息,该消息数据至少包括消息发送者数据、消息接收方(或接收者)数据和净荷。下面参照图4描述关于可以被包括在消息中并且被包括在存储在消息表302中的消息数据内的信息的其他的细节。
[0061] 实体表306存储实体数据,并且(例如,参考地)链接至实体图308和简档数据316。针对其记录被维护在实体表306内的实体可以包括个人、公司实体、组织、对象、地点、事件等。无论实体类型如何,消息收发服务器系统108存储关于其的数据的任何实体可以是识别的实体。每个实体被提供有唯一标识符以及实体类型标识符(未示出)。
[0062] 实体图308存储与实体之间的关系和关联有关的信息。仅作为示例,这样的关系可以是社交的、职业的(例如,在共同的公司或组织工作)、基于兴趣或者基于活动的。
[0063] 简档数据316存储关于特定实体的多种类型的简档数据。基于由特定实体指定的隐私设置,简档数据316可以被选择性地使用并呈现给消息收发系统100的其他用户。在实体是个人的情况下,简档数据316包括例如用户名、电话号码、地址、设置(例如,通知和隐私设置)、以及用户所选择的化身表示(或这样的化身表示的集合)。然后,特定用户可以将这些化身表示中的一个或更多个化身表示选择性地包括在经由消息收发系统100传送的消息的内容内以及包括在由消息收发客户端104向其他用户显示的地图界面上。化身表示的集合可以包括“状况化身”,其呈现用户可以选择以在特定时间进行通信的状况或活动的图形表示。
[0064] 在实体是团体的情况下,除了团体名称、成员和相关团体的各种设置(例如,通知)之外,团体的简档数据316还可以类似地包括与团体相关联的一个或更多个化身表示。
[0065] 数据库126还在增强表310中存储增强数据,例如叠加或过滤器。增强数据与视频(其数据被存储在视频表304中)和图像(其数据被存储在图像表312中)相关联并且被应用于所述视频和图像。
[0066] 在一个示例中,过滤器是在向接收方用户呈现期间显示为叠加在图像或视频上的叠加。过滤器可以是各种类型的,包括当发送用户正在编写消息时从由消息收发客户端104呈现给发送用户的一组过滤器中用户选择的过滤器。其他类型的过滤器包括地理定位过滤器(也称为地理过滤器),其可以基于地理定位被呈现给发送用户。例如,可以基于由客户端装置102的全球定位系统(GPS)单元确定的地理定位信息,由消息收发客户端104在用户界面内呈现特定于附近或特殊定位的地理定位过滤器。
[0067] 另一种类型的过滤器是数据过滤器,其可以由消息收发客户端104基于在消息创建处理期间由客户端装置102收集的其他输入或信息选择性地呈现给发送用户。数据过滤器的示例包括特定定位处的当前温度、发送用户出行的当前速度、客户端装置102的电池寿命或当前时间。
[0068] 可以被存储在图像表312内的其他增强数据包括增强现实内容项(例如,对应于应用透镜或增强现实体验)。增强现实内容项可以是可以被添加至图像或视频的实时特殊效果和声音。
[0069] 如上所述,增强数据包括增强现实内容项、叠加、图像变换、AR图像以及指代可以应用于图像数据(例如,视频或图像)的修改的类似术语。这包括实时修改,实时修改在使用客户端装置102的装置传感器(例如,一个或更多个摄像装置)捕获图像时对图像进行修改并且然后在客户端装置102的屏幕上显示修改的图像。这还包括对所存储的内容诸如图库中可以被修改的视频片段的修改。例如,在可以访问多个增强现实内容项的客户端装置102中,用户可以使用具有多个增强现实内容项的单个视频片段来观看不同的增强现实内容项将如何修改所存储的片段。例如,通过为内容选择不同的增强现实内容项,可以将应用不同伪随机移动模型的多个增强现实内容项应用于该相同内容。类似地,实时视频捕获可以与所示出的修改一起使用,以示出当前由客户端装置102的传感器捕获的视频图像将如何修改所捕获的数据。这样的数据可以简单地显示在屏幕上而不存储在存储器中,或者由装置传感器捕获的内容可以在进行或不进行修改(或两者)的情况下被记录并被存储在存储器中。在一些系统中,预览功能可以显示不同的增强现实内容项将同时在显示器的不同窗口内显示的情形。这可以例如使得能够同时在显示器上查看具有不同伪随机动画的多个窗口。
[0070] 因此,使用增强现实内容项的数据和各种系统或使用该数据修改内容的其他这样的变换系统可以涉及视频帧中对象(例如,面部、手、身体、猫、狗、表面、物体等)的检测;在这些对象离开视场、进入视场以及在视场四处移动时对这些对象的跟踪;以及在跟踪这些对象时对其进行的修改或变换。在各种示例中,可以使用用于实现这样的变换的不同的方法。一些示例可以涉及:生成一个或多个对象的三维网格模型以及在视频内使用模型的变换和动画纹理来实现变换。在其他示例中,可以使用对象上的点的跟踪将图像或纹理(其可以是二维或三维的)放置在所跟踪的位置处。在更进一步的示例中,可以使用视频帧的神经网络分析来将图像、模型或纹理放置在内容(例如,图像或视频帧)中。因此,增强现实内容项既指用于在内容中创建变换的图像、模型和纹理,也指利用对象检测、跟踪和放置实现这样的变换所需的附加建模和分析信息。
[0071] 可以利用保存在任何种类的计算机化系统的存储器中的任何种类的视频数据(例如,视频流、视频文件等)来执行实时视频处理。例如,用户可以加载视频文件并将它们保存在装置的存储器中,或者可以使用装置的传感器来生成视频流。此外,可以使用计算机动画模型来处理任何对象,例如人的面部和人身体的各部分、动物或非生物(例如,椅子、汽车或其他对象)。
[0072] 在一些示例中,在特定修改与要变换的内容一起被选择的情况下,由计算装置识别要变换的元素,并且然后如果要变换的元素存在于视频帧中,则检测并跟踪要变换的元素。根据针对修改的请求来修改对象的元素,从而变换视频流的帧。可以通过用于不同类型的变换的不同方法来执行视频流的帧的变换。例如,对于主要涉及改变对象的元素的形式的帧的变换,计算对象的每个元素的特性点(例如,使用主动形状模型(ASM)或其他已知方法)。然后,针对对象的至少一个元素中的每个元素,生成基于特性点的网格。该网格被用于在视频流中跟踪对象的元素的后续阶段。在跟踪的过程中,所提及的针对每个元素的网格与每个元素的位置对准。然后,在网格上生成附加点。基于对修改的请求针对每个元素生成第一点的第一集合,并且基于第一点的集合和对修改的请求针对每个元素生成第二点的集合。然后,可以通过基于第一点的集合和第二点的集合以及网格修改对象的元素来变换视频流的帧。在这样的方法中,也可以通过跟踪和修改所修改对象的背景来使所修改对象的背景改变或变形。
[0073] 在一些示例中,使用对象的元素来改变对象的一些区域的变换可以通过计算对象的每个元素的特性点并基于所计算的特性点生成网格来执行。在网格上生成点,然后基于所述点生成各种区域。然后,通过将每个元素的区域与至少一个元素中的每个元素的位置对准来跟踪对象的元素,并且可以基于修改请求来修改区域的性质,从而变换视频流的帧。取决于具体的修改请求,可以以不同的方式来变换所提及的区域的性质。这样的修改可以涉及:改变区域的颜色;从视频流的帧中移除区域的至少一些部分;将一个或更多个新对象包括在基于修改请求的区域中;以及对区域或对象的元素进行修改或使其发生扭曲。在各种示例中,可以使用这样的修改或其他类似修改的任何组合。对于要被动画化的某些模型,可以选择一些特性点作为控制点以用于确定针对模型动画的选项的整个状态空间。
[0074] 在使用面部检测来变换图像数据的计算机动画模型的一些示例中,使用特定的面部检测算法(例如,Viola‑Jones)在图像上检测面部。然后,将主动形状模型(ASM)算法应用于图像的面部区域以检测面部特征参考点。
[0075] 可以使用其他适合面部检测的方法和算法。例如,在一些示例中,使用界标来定位特征,该界标表示在所考虑的大多数图像中存在的可区分点。例如,对于面部界标,可以使用左眼瞳孔的定位。如果初始界标不可识别(例如,如果人带眼罩),则可以使用次级界标。这样的界标识别过程可以被用于任何这样的对象。在一些示例中,一组界标形成形状。可以使用形状中的点的坐标来将形状表示为矢量。利用使形状点之间的平均欧几里德距离最小化的相似性变换(允许平移、缩放和旋转)将一个形状与另一个形状对准。平均形状(mean shape)是经对准的训练形状的平均值。
[0076] 在一些示例中,从与由全局面部检测器确定的面部的位置和大小对准的平均形状开始搜索界标。然后,这样的搜索重复以下步骤:通过模板匹配每个点周围的图像纹理来调整形状点的定位来建议暂定形状,并且然后使暂定形状符合全局形状模型,直到发生收敛。在一些系统中,个体模板匹配是不可靠的,并且形状模型将弱模板匹配的结果进行池化,以形成更强的整体分类器。整个搜索在从粗分辨率到细分辨率的图像金字塔的每个级别上重复。
[0077] 变换系统可以在客户端装置(例如,客户端装置102)上捕获图像或视频流,并在客户端装置102上本地执行复杂的图像操纵,同时维持适当的用户体验、计算时间和功耗。复杂的图像操纵可以包括大小和形状改变、情绪变换(例如,将面部从皱眉改变为微笑)、状态变换(例如,使主体变老、减小外表年龄、改变性别)、风格变换、图形元素应用以及由已经被配置成在客户端装置102上有效执行的卷积神经网络实现的任何其他合适的图像或视频操纵。
[0078] 在一些示例中,用于变换图像数据的计算机动画模型可以由系统使用,在该系统中,用户可以使用具有神经网络的客户端装置102来捕获用户的图像或视频流(例如,自拍),该神经网络操作为在客户端装置102上操作的消息收发客户端104的一部分。在消息收发客户端104内操作的变换系统确定图像或视频流内的面部的存在,并且提供与计算机动画模型相关联的修改图标以变换数据图像,或者计算机动画模型可以被呈现为与本文中描述的界面相关联。修改图标包括以下改变,该改变可以是作为修改操作的一部分来修改图像或视频流内的用户的面部的基础。一旦选择了修改图标,则变换系统发起对用户的图像进行转换以反映所选择的修改图标(例如,在用户上生成笑脸)的过程。一旦捕获图像或视频流并且选择了指定的修改,就可以在客户端装置102上显示的图形用户界面中呈现经修改的图像或视频流。变换系统可以在图像或视频流的一部分上实现复杂的卷积神经网络,以生成和应用选择的修改。也就是说,用户可以捕获图像或视频流,并且一旦已经选择了修改图标,就可以实时或接近实时地呈现经修改的结果。此外,当正在捕获视频流时,修改可以是持久的,并且选择的修改图标保持被切换。机器学习的神经网络可以用于实现这样的修改。
[0079] 呈现由变换系统执行的修改的图形用户界面可以为用户供应附加的交互选项。这样的选项可以基于用于发起内容捕获以及选择特定计算机动画模型的界面(例如,从内容创建者用户界面发起)。在各种示例中,在最初选择了修改图标之后,修改可以是持久的。用户可以通过轻击或以其他方式选择正由变换系统修改的面部来将修改切换为打开或关闭,并对其进行存储以供稍后观看或浏览成像应用的其他区域。在由变换系统修改多个面部的情况下,用户可以通过轻击或选择在图形用户界面内修改和显示的单个面部来全局地将修改切换为打开或关闭。在一些示例中,可以单独修改多个面部组中的各个面部,或者可以通过轻击或选择图形用户界面内显示的单独面部或一系列面部来单独切换这样的修改。
[0080] 故事表314存储关于消息的集合的数据以及相关联的图像、视频或音频数据,这些数据被汇编成集合(例如,故事或图库)。特定集合的创建可以由特定用户(例如,在实体表306中维护其记录的每个用户)发起。用户可以以已由该用户创建和发送/广播的内容的集合的形式创建“个人故事”。为此,消息收发客户端104的用户界面可以包括用户可选择的图标,以使得发送用户能够将特定内容添加到他或她的个人故事。
[0081] 集合还可以构成作为来自多个用户的内容的集合的“实况故事”,其是手动地、自动地或者使用手动技术和自动技术的组合创建的。例如,“实况故事”可以构成由来自不同定位和事件的用户提交的内容的策展流。可以例如经由消息收发客户端104的用户界面向其客户端装置启用了定位服务并且在特定时间处于共同定位事件处的用户呈现选项,以将内容贡献给特定的实况故事。可以由消息收发客户端104基于他或她的定位向用户标识实况故事。最终结果是从社群角度讲述的“实况故事”。
[0082] 另一类型的内容集合被称为“定位故事”,“定位故事”使得其客户端装置102被定位于特定地理定位(例如,在学院或大学校园)内的用户能够对特定集合做出贡献。在一些实施方式中,对定位故事的贡献可能需要二级认证,以验证最终用户属于特定的组织或其他实体(例如,是大学校园的学生)。
[0083] 如以上提及的,视频表304存储视频数据,在一个示例中,该视频数据与其记录被保存在消息表302内的消息相关联。类似地,图像表312存储与其消息数据被存储在实体表306中的消息相关联的图像数据。实体表306可以使来自增强表310的各种增强与存储在图像表312和视频表304中的各种图像和视频相关联。
[0084] 数据通信架构
[0085] 图4是示出根据一些示例的消息400的结构的示意图,该消息400由消息收发客户端104生成,以传送至另外的消息收发客户端104或消息收发服务器118。特定消息400的内容用于填充存储在可由消息收发服务器118访问的数据库126内的消息表302。类似地,消息400的内容被存储在存储器中作为客户端装置102或应用服务器114的“传输中”或“飞行中”数据。消息400被示为包括以下示例组成部分:
[0086] ·消息标识符402:标识消息400的唯一标识符。
[0087] ·消息文本净荷404:要由用户经由客户端装置102的用户界面生成并且包括在消息400中的文本。
[0088] ·消息图像净荷406:由客户端装置102的摄像装置部件捕获的或从客户端装置102的存储器部件检索到的并且包括在消息400中的图像数据。针对发送或接收的消息400的图像数据可以存储在图像表312中。
[0089] ·消息视频净荷408:由摄像装置部件捕获的或从客户端装置102的存储器部件检索到的并且包括在消息400中的视频数据。针对发送或接收的消息400的视频数据可以被存储在视频表304中。
[0090] ·消息音频净荷410:由麦克风捕获的或从客户端装置102的存储器部件检索到的并且包括在消息400中的音频数据。
[0091] ·消息增强数据412:表示要应用于消息400的消息图像净荷406、消息视频净荷408、或消息音频净荷410的增强的增强数据(例如,过滤器、标贴或其他注释或增强)。针对发送或接收的消息400的增强数据可以被存储在增强表310中。
[0092] ·消息持续时间参数414:指示消息的内容(例如,消息图像净荷406、消息视频净荷408、消息音频净荷410)将经由消息收发客户端104呈现给用户或使其可由用户访问的以秒为单位的时间量的参数值。
[0093] ·消息地理定位参数416:与消息的内容净荷相关联的地理定位数据(例如,纬度坐标和经度坐标)。在净荷中可以包括多个消息地理定位参数416值,这些参数值中的每个参数值与内容中所包括的内容项(例如,消息图像净荷406内的特定图像或者消息视频净荷408中的特定视频)相关联。
[0094] ·消息故事标识符418:标识与消息400的消息图像净荷406中的特定内容项相关联的一个或更多个内容集合(例如,在故事表314中标识的“故事”)的标识符值。例如,消息图像净荷406内的多个图像可以各自使用标识符值与多个内容集合相关联。
[0095] ·消息标签420:每个消息400可以用多个标签来标记,所述多个标签中的每个标签指示消息净荷中包括的内容的主题。例如,在包括在消息图像净荷406中的特定图像描绘动物(例如,狮子)的情况下,标签值可以被包括在指示相关动物的消息标签420内。标签值可以基于用户输入手动生成,或者可以使用例如图像识别自动生成。
[0096] ·消息发送者标识符422:指示在其上生成消息400并且从其发送消息400的客户端装置102的用户的标识符(例如,消息收发系统标识符、电子邮件地址或装置标识符)。
[0097] ·消息接收者标识符424:指示消息400寻址到的客户端装置102的用户的标识符(例如,消息收发系统标识符、电子邮件地址或装置标识符)。
[0098] 消息400的各个组成部分的内容(例如,值)可以是指向表中的存储内容数据值的定位的指针。例如,消息图像净荷406中的图像值可以是指向图像表312内的定位的指针(或图像表312内的定位的地址)。类似地,消息视频净荷408内的值可以指向存储在视频表304内的数据,存储在消息增强412内的值可以指向存储在增强表310中的数据,存储在消息故事标识符418内的值可以指向存储在故事表314中的数据,并且存储在消息发送者标识符422和消息接收者标识符424内的值可以指向存储在实体表306内的用户记录。
[0099] 基于时间的访问限制架构
[0100] 图5是示出访问限制过程500的示意图,就该访问限制过程500而言,对内容(例如,短暂消息502和相关联的数据的多媒体净荷)或内容集合(例如,短暂消息组504)的访问可以是时间受限的(例如,被制成短暂的)。
[0101] 短暂消息502被示出成与消息持续时间参数506相关联,该消息持续时间参数506的值确定消息收发客户端104将向短暂消息502的接收用户显示短暂消息502的时间量。在一个示例中,取决于发送用户使用消息持续时间参数506指定的时间量,接收用户可查看短暂消息502长达最多10秒。
[0102] 消息持续时间参数506和消息接收者标识符424被示出为消息定时器510的输入,该消息定时器510负责确定向由消息接收者标识符424标识的特定接收用户示出短暂消息502的时间量。特别地,将仅在由消息持续时间参数506的值确定的时间段内向相关接收用户示出短暂消息502。消息定时器510被示出为向更一般化的短暂定时器系统202提供输出,该短暂定时器系统202负责向接收用户显示内容(例如,短暂消息502)的总体定时。
[0103] 短暂消息502在图5中被示出为被包括在短暂消息组504(例如,个人故事或事件故事中的消息的集合)内。短暂消息组504具有相关联的组持续时间参数508,该组持续时间参数508的值确定短暂消息组504被呈现并可由消息收发系统100的用户访问的持续时间。例如,组持续时间参数508可以是音乐会的持续时间,其中短暂消息组504是关于该音乐会的内容的集合。替选地,当执行短暂消息组504的设置和创建时,用户(拥有用户或策展者用户)可以指定组持续时间参数508的值。
[0104] 此外,短暂消息组504内的每个短暂消息502具有相关联的组参与参数512,该组参与参数512的值确定在短暂消息组504的上下文内将可访问短暂消息502的持续时间。因此,在短暂消息组504本身根据组持续时间参数508到期之前,特定的短暂消息组504可以在短暂消息组504的上下文中“到期”并且变得不可访问。组持续时间参数508、组参与参数512和消息接收者标识符424各自向组定时器514提供输入,该组定时器514可操作地首先确定短暂消息组504中的特定短暂消息502是否将被显示给特定接收用户,并且如果为是,则确定显示多长时间。注意,由于消息接收者标识符424,短暂消息组504也知道特定接收用户的身份。
[0105] 因此,组定时器514可操作地控制相关联的短暂消息组504以及短暂消息组504中包括的单独的短暂消息502的整体寿命。在一个示例中,短暂消息组504内的每个短暂消息502在由组持续时间参数508指定的时间段内保持可查看和可访问。在另一示例中,在短暂消息组504的上下文内,某个短暂消息502可以基于组参与参数512而到期。注意,即使在短暂消息组504的上下文内,消息持续时间参数506也仍然可以确定向接收用户显示特定短暂消息502的持续时间。因此,消息持续时间参数506确定向接收用户显示特定短暂消息502的持续时间,而不管接收用户是在短暂消息组504的上下文之内还是之外查看该短暂消息
502。
[0106] 短暂定时器系统202还可以基于确定已经超过相关联的组参与参数512而从短暂消息组504中可操作地移除特定短暂消息502。例如,在发送用户已经建立了从发布起24小时的组参与参数512的情况下,短暂定时器系统202将在指定的24小时之后从短暂消息组504中移除相关的短暂消息502。短暂定时器系统202还进行操作以在针对短暂消息组504内的每个短暂消息502的组参与参数512已经到期时,或者在短暂消息组504本身根据组持续时间参数508已经到期时,移除短暂消息组504。
[0107] 在某些使用情况下,特定短暂消息组504的创建者可以指定无期限的组持续时间参数508。在这种情况下,针对短暂消息组504内最后剩余的短暂消息502的组参与参数512的到期将确定短暂消息组504本身何时到期。在这种情况下,添加至短暂消息组504的具有新的组参与参数512的新的短暂消息502有效地将短暂消息组504的寿命延长到等于组参与参数512的值。
[0108] 响应于短暂定时器系统202确定短暂消息组504已经到期(例如,不再是可访问的),短暂定时器系统202与消息收发系统100(并且例如特别是消息收发客户端104)通信,以使与相关短暂消息组504相关联的标记(例如,图标)不再显示在消息收发客户端104的用户界面内。类似地,当短暂定时器系统202确定针对特定短暂消息502的消息持续时间参数506已经到期时,短暂定时器系统202使消息收发客户端104不再显示与短暂消息502相关联的标记(例如,图标或文本标识)。
[0109] 解锁自主无人机
[0110] 图6示出了根据一些示例的用于自主无人机的部件600的示例。图6中所示的部件600是诸如图7、图8、图10和图11中所示的自主无人机710的自主无人机的一部分。部件600被组织成包括输入/输出装置602、处理器604、存储器606、电池608、电力芯片610、传感器
648、无线连接666、电力和通信连接646以及推进系统684的功能组。本领域技术人员将认识到,部件600可以被组织成不同的功能组,或者可以全部单独地是自主无人机的一部分。
[0111] 部件600经由电力和通信连接646连接。根据一些示例,电力和通信连接646包括一个或更多个通信总线、电力总线和/或点对点连接。另外,部件600中的一个或更多个部件可以是可选的。并且部件600可以包括附加部件。此外,如所示的部件的数目可以是不同的。例如,可以存在多个处理器604。术语电气和电子可以用于指代电气部件和/或电子部件。
[0112] 推进系统684包括电动机686,其中每个电动机686包括与螺旋桨690相关联的旋翼688。根据一些示例,螺旋桨690向自主无人机710提供动力升力,以及使自主无人机加速和旋转。一旦响应于包括来自例如处理器604的电动机操作指令的信号就致动的电动机686使旋翼688自旋,旋翼688使螺旋桨690自旋。电动机686和致动器638由电池608和/或电力芯片
610供电,并且由来自处理器604的信号控制。根据一些示例,电动机686是可变的电动机。在一些示例中,电动机686具有低设置,处理器604可以使用该低设置来向自主无人机的用户指示自主无人机正准备起飞。
[0113] 具有多于一个的螺旋桨690使得自主无人机能够在电动机686、旋翼688或螺旋桨690中的一个或更多个发生故障时继续飞行。例如,如果电动机686中的一个电动机发生故障,则自主无人机710仍然可以保持在高空,其中其余电动机686协同工作以进行补偿。在一些示例中,推进系统684向处理器604发送指示电动机686未适当运转的信号。在一些示例中,电动机686向处理器604提供指示电动机686是否适当操作的信号。另外,结合到自主无人机中的电动机686的数目越大,自主无人机710将生成的升力就越大,从而允许自主无人机携带更重的净荷,例如一个或更多个传感器648。
[0114] 在一些示例中,推进系统684包括一个或更多个致动器638,其使电动机686倾斜,使得电动机686可以相对于自主无人机的参照系以一定角度操作。例如,每个电动机686以单个旋转轴旋转地安装在自主无人机上,其中致动器638控制电动机686的角度。在一些示例中,每个电动机686旋转地安装有由一个或更多个致动器638控制的两个或更多个旋转轴。在一些示例中,一个或更多个致动器638控制多于一个的电动机686的角度。
[0115] 功能组包括传感器648,该传感器648具有包括摄影摄像装置650、导航摄像装置651、惯性测量单元(IMU)A 652、测高仪654、陀螺仪656、IMU B 658、加速度计665、高度检测器660(其包括灯662和光检测器664)、磁传感器659、风速传感器661、时钟663、运动传感器
667、麦克风669、取向671等的部件600。
[0116] 在一些示例中,传感器648生成由处理器604处理并作为数据存储在存储器606中(例如作为数据630存储在存储器1 626中或作为数据636存储在存储器N 632中)的数据。例如,测高仪654是用于确定达到的高度的仪器。因此,当自主无人机被设置成悬停在适当的位置时,处理器604使用来自测高仪654的数据来确定高度并调整推进系统684以保持该高度。
[0117] 替选地或另外地,高度检测器660用于生成可以用于确定自主无人机在地面上方的高度的数据。例如,高度检测器660的灯662被安装在自主无人机的底部上以将光向下照射向地面,其反射并命中光检测器664。处理器604使用从由灯662照射光并在光检测器664处接收光而生成的数据来基于光的飞行时间和光的速度确定自主无人机在地面上方的高度。灯662是足够强以产生在地面上的由光检测器664可检测的反射的合适光源。在一些示例中,灯662发射特定波长处的电磁辐射,光检测器664被制造成检测该特定波长。在一些示例中,还基于自主无人机的滚转和俯仰来确定高度,以说明灯662可能不是笔直向下照射光的事实。在一些示例中,高度检测器660基于声纳。
[0118] IMU A 652和IMU B 658使用加速度计、陀螺仪和可选地磁力计的组合来输出诸如自主无人机的比力(specific force)、角速率和自主无人机的取向的测量结果。测高仪654、陀螺仪656、加速度计665和其他传感器648可以由IMU A 652和/或IMU B 658代替。传感器648的各种组合可以用于生成导航自主无人机所需的数据。在一些示例中,传感器648包括激光雷达系统、雷达系统、光传感器或可以用于辅助导航和/或摄影的其他形式的传感器。在一些示例中,包括使得自主无人机能够确定自主无人机的俯仰、偏航和滚转的传感器
648。在一些示例中,传感器648包括运动传感器667,该运动传感器667不需要电力,但基于正在移动的自主无人机来生成信号。运动传感器667可以用于生成处理器604响应的事件。
[0119] 摄影摄像装置650以及其他传感器648生成可以出于为自主无人机的用户显示或保存数据的目的而被捕获的数据。摄影摄像装置650包括被分成像素的传感器。在一些示例中,摄影摄像装置650相对于自主无人机710的螺旋桨690的轴线水平地安装,并且导航摄像装置651相对于螺旋桨690的轴线竖直地安装并且被定向成朝下。
[0120] 传感器基于照在传感器上的光生成电信号。在一些示例中,参照图9,生成的数据与自主无人机710的位置952和时间936相关联。在一些示例中,IMU A 652与摄影摄像装置650耦接,这使得处理器604能够使摄影摄像装置650稳固以获取改善的摄影影像(photography),并且确定照片是否因为摄影摄像装置650尚未稳固而不可靠。摄影摄像装置651可以旋转地安装在自主无人机的主体上,从而经由一个或更多个致动器或其他机构耦接至主体以控制摄影摄像装置650相对于自主无人机的主体的取向。IMU B 658被附接至自主无人机以提供用于导航的数据。处理器604使用由IMU生成的数据供导航,并且在一些示例中,以使摄影摄像装置650稳固。在一些示例中,存在多于一个的摄影摄像装置650。
[0121] 导航摄像装置651被安装在自主无人机的主体上以提供数据来辅助自主无人机的导航。可以存在多于一个的导航摄像装置651。例如,导航可以是被安装到自主无人机的主体上的前置摄像装置,其中导航摄像装置651被定位成拾取自主无人机所指向的场景的图像。另外地或替代地,导航摄像装置651可以被竖直地安装在自主无人机的主体上,其中导航摄像装置651被定位成拾取被飞越的地带的图像。一个或更多个导航摄像装置651可以可移动地或固定地安装在自主无人机的主体上,从而经由一个或更多个致动器或其他机构耦接至主体以控制一个或更多个导航摄像装置651相对于自主无人机的主体的取向。在一些示例中,摄影摄像装置650还用作导航摄像装置651。在一些示例中,摄影摄像装置650与导航摄像装置651相比提供更大的像素分辨率并且需要更大的功率来操作。
[0122] 由摄影摄像装置650和导航摄像装置651捕获的诸如视频和数字图像的数据可以作为数据630、636被存储在存储器606中。此外,由摄影摄像装置650和/或导航摄像装置651捕获的数据可以使用无线连接以近乎实时的方式无线地流式传输至外部装置682。另外,自主无人机可以向外部装置682发送或从外部装置682接收包括指令的数据。
[0123] 磁传感器659提供关于自主无人机在磁场内的取向的数据。风速传感器661指示风速,所述风速可以是表面上的风速和/或方向,处理器604可以使用其来基于自主无人机的飞行特性和设置(诸如,至电动机686的电力)估计真实风速。时钟663生成指示时间的数据。在一些实施方式中,时钟663指示格林尼治标准时间。在一些实施方式中,时钟663生成相对于诸如自主无人机的供电的事件的时间。麦克风669将声波转变成电信号,该电信号可以作为由处理器604处理的数据630、636被存储。取向671是指示自主无人机710的取向的传感器。例如,取向671指示自主无人机是正面朝上还是上下颠倒。
[0124] 无线连接666包括可以包括无线电波和/或光波的一个或更多个无线协议。如所示出的,无线连接666包括GPS芯片668、连接至收发器/天线672的较低功率的无线芯片670和连接至收发器/天线678的较高功率的无线芯片676。GPS芯片668被连接至可以在芯片内部或外部的天线/收发器。GPS芯片668接收来自卫星的通信,并且使用根据接收来自多个卫星的信号的信息来确定自主无人机的位置。GPS芯片668是较高功率的芯片676。在一些示例中,处理器604从外部装置682接收GPS芯片668的操作所需的设置数据,其中该设置数据可以包括关于GPS芯片668从其接收信号的卫星的信息,其中该数据可以包括关于卫星的位置信息。
[0125] 较低功率的无线芯片670可以包括执行一个或更多个较低功率的无线协议的芯片。例如,蓝牙低能耗(BLE)可以用于与更近的外部装置682通信。较高功率的无线芯片676包括执行一个或更多个较高功率的无线协议的芯片。例如,3GPP协议和IEEE 802.11协议。
[0126] 输入/输出装置602向可以由用户使用的自主无人机提供输入和输出。指示灯612指示自主无人机的状况并且对于自主无人机的用户是可见的。例如,指示灯612可以指示开与关、充电水平、诸如充电或不充电的充电状态、待机状态、存储器中是否存在照片或视频、存储器是满的还是未满、无线连接666是开还是关等。诸如LCD显示器的电子显示器可以是除了指示灯612之外的或代替指示灯612。在一些实施方式中,按钮618中的一个按钮是飞行按钮,该飞行按钮当被按压时向自主无人机710指示它应该起飞。
[0127] 可以采取其他形式的控制旋钮614是为用户提供控制自主无人机的操作的能力的安装在自主无人机的外部的旋钮。根据一些实施方式,控制旋钮614可以被称为控制用户界面装置或其他类似的术语。控制旋钮614具有多个位置或状态,例如关、开、用于将诸如图像的数据传送出自主无人机的传送、各种飞行路径和行为等。状态615是向处理器604提供关于控制旋钮614的设置的信息的内部状态。除了控制旋钮614之外或代替控制旋钮614,可以使用其他输入和输出用户界面项。
[0128] 连接器616是提供从外部装置682至自主无人机的电力连接和/或数据连接的外部连接器。例如,存在用于对自主无人机充电的电力连接器616。电力连接器616或另一连接器616可以用于向主机装置传送数据或用于从另一电源接收电力。在一些示例中,连接器616是无线可再充电的连接器616,使得自主无人机被放置在充电底座上或靠近充电底座。在一些示例中,存在用于微型安全数字(SD)卡或另一外部存储装置的连接器616。
[0129] 在一些示例中,存在用于执行一个或更多个功能的按钮618。例如,按钮618当被按压时指示自主无人机执行由控制旋钮614指示的任何功能,例如尽可能快地起飞和拍摄自主无人机的用户的肖像照片。
[0130] 处理器604执行指令620以处理数据630、636和/或以控制自主无人机的操作。指令620是指定处理器604要执行的操作的机器指令,并且可以被存储在作为处理器604芯片的一部分的高速缓冲存储器中。电力部分1 622至电力部分N 624指示处理器604被分成不同的部分,使得电力芯片610可以根据自主无人机的不同电力状态641来选择向处理器604的哪些部分提供电力。在整个讨论中,处理器604被描述为确定各种功能的参与者,但是本领域技术人员将认识到,专用芯片可以被包括在自主无人机的各种部件中以执行特定功能。
例如,高度检测器660可以包括处理电路系统,其确定在地面上方的高度并输出指示在地面上方的高度的数据以供处理器604消耗。
[0131] 存储器606包括存储器1 626至存储器N 632。存储器1 626和存储器N 632分别包括指令628、634和数据630、636。处理器604和一个或更多个其他部件600可经由电力和通信连接646访问存储器。存储器1 626至存储器N 632的存储器是主存储器,其被用于存储由传感器648生成的数据以及用于诸如到无线连接666和来自无线连接666的通信的其他数据。根据一些示例,主存储器是诸如DRAM或RAM的动态存储器。存储器1626至存储器N 632的另一存储器是诸如SRAM的静态存储器或不需要电力来维持状态的ROM。在一些示例中,存储器
1 626至存储器N 632的另一存储器是作为机器可读介质的存储单元。例如,存储单元是可移除的微型SD卡。电力芯片610具有至不同存储器的连接,使得电力芯片610可以向存储器1 
626至存储器N 632的存储器中的一个或更多个存储器提供电力。指令628、634和数据630、
636完全地或部分地驻留在主存储器、静态存储器、存储单元内和/或处理器604内,例如在高速缓冲存储器内,或其任何合适的组合内。主存储器、静态存储器、存储单元和处理器604的存储器是机器可读介质的示例。
[0132] 自主无人机可以具有控制自主无人机的飞行路径和操作的预编程的飞行路径或操作。例如,参照图9,预编程的飞行计划960。预编程的飞行计划960可以与控制旋钮614的位置或状态615相关联。存储器606存储预编程的飞行路径或操作。在一些示例中,自主无人机从外部装置682下载新的预编程的飞行路径或操作。
[0133] 替选地或除此之外,自主无人机的移动可以由作为远程控制装置的诸如外部装置682的远程控制器控制,如果自主无人机不充当自主无人机,则飞行员或用户可以使用该远程控制装置来启动、降落、拍摄照片或视频以及导航自主无人机。在这些实施方式中,自主无人机不充当自主无人机而是远程控制的无人机。远程控制器可以采取许多形式,从类似游戏手柄的控制器到智能手机和平板电脑。无论它们的设计如何,远程控制器都需要与自主无人机通信,并且通常使用无线电波进行通信。例如,无人机通常通过2.4千兆赫的无线电波运行。为了与自主无人机通信,许多无人机控制器使用IEEE 802.11的通信协议中的一种协议,其可以被称为Wi‑Fi,其可以在2.4千兆赫的频谱上传输,并且由智能手机和平板电脑用于通信。在一个示例中,参照图7,无人机710使用Wi‑Fi或 与智能手机708通信。
外部装置682包括远程控制/主机装置,例如场外(off‑site)客户端装置704、服务器706、智能手机708或其他装置。
[0134] 需要电源来向电动机686供电并向其他部件600供电。在一些示例中,自主无人机包括一个或更多个电池608作为用于诸如电动机686的部件600的电源。根据一些示例,电池608是可移除的。在一些示例中,电池608是可再充电的,其中一个或更多个连接器616直接地或经由电气或电子部件连接至电池608。在一些示例中,电力芯片640通过执行各种功能,例如确定电池608的电荷、打开或关闭再充电、给电池608的输出提供电容器、电阻器和/或电感器等来管理电池608。在一些示例中,电力芯片640包括电力状态641,其指示自主无人机的部件600中的哪些部件当前正在被供电。电力状态641包括不同的电力状态641,例如电力状态1 642至电力状态N 644。不同的电力状态641向部件600的不同子集提供电力,并且因此消耗不同量的电力并且为如本文中所讨论的自主无人机提供不同级别的功能。不同的电力状态641通过向不同的电力集合和通信连接646提供电力来实现。在一些示例中,部件
600被包括为机器1500的一部分。在一些示例中,部件600中的一个或更多个部件是具有运行诸如 的实时操作系统的处理器604的主板的一部分。
[0135] 图7是示出根据一些示例的自主无人机系统700的示意图。在一些示例中,自主无人机710是自主无人机或半自主无人机。自主无人机710通过使用图6的无线连接666向远程控制/主机装置,诸如场外客户端装置704、服务器706、移动电话或智能手机708或另一装置发送通信712、713来进行通信。无线网络702是蜂窝电话网络,例如LTE网络、IEEE 802.11网络、 网络或使用另一无线通信协议的另一无线网络。在一些示例中,自主无人机710经由通信713直接地与远程控制/主机装置通信,其中使用通信协议例如针对无线网络702所讨论的通信协议来发送通信713。
[0136] 在示例中,自主无人机710向诸如智能手机708的另一装置发送包括数据和/或命令或请求的通信712、713。在一些情况下,诸如智能手机708的远程控制/主机装置与自主无人机710之间的通信可以经由无线网络702。无线网络702可以包括对因特网的访问以及/或者自主无人机710可以经由诸如智能手机708的另一连接的装置访问因特网。
[0137] 在一些示例中,服务器706提供社交网络服务,以使得能够从可能处于飞行中的自主无人机710将诸如照片、视频、状况更新、媒体内容消息等的内容直接地通信至诸如的社交媒体网站。在一些示例中,服务器706是消息收发服务器系统108,并且由无人机710的摄影摄像装置650捕获的数据经由无线网络702传播或以其他方式通信(其可以是近乎实时的)至诸如智能手机708的远程控制/主机装置,至服务器706、客户端装置704或另一装置。自主无人机710可以直接地或经由另一装置与图2的无人机管理系统216联系。
[0138] 诸如智能手机708的远程控制/主机装置中的一个或更多个装置可以通过无线地接收数据、处理数据、并且然后将信息无线地发送回至自主无人机710来辅助诸如数据630的数据的处理。例如,智能手机708可以从自主无人机710接收图像,并且确定该图像是地标,例如博物馆、餐馆、公园、国家纪念物等。智能手机708可以发送回由自主无人机710使用的信息以辅助与地标相关联的飞行路径。智能手机708可以联系无人机管理系统216以执行用于自主无人机710的功能。自主无人机710可以通过向自主无人机管理系统216发送诸如为用户存储数据、请求自主无人机的用户或购买者等命令来联系自主无人机管理系统216。
[0139] 在一些示例中,诸如智能手机708的远程控制/主机装置包括相关联的应用,所述相关联的应用可以由用户或装置使用来控制自主无人机710或向自主无人机710发送指令,例如返回至用户、采取特定设置的飞行、向左移动、向右移动、向上或向下移动、倾斜、拍摄一组照片、关闭等。相关联的应用可以提供自主无人机710正在捕获的视频的实时或近乎实时的图像。在一些示例中,相关联的应用使得用户能够通过设置超时、条件和/或阈值来配置自主无人机710。另外,用户可以选择关于无线连接666的配置以指示哪些无线协议应该用于自主无人机的哪些状态中。
[0140] 在一些示例中,远程控制/主机装置充当路由器或将消息或数据包传递至直接地或间接地连接至无线网络702的其他装置。例如,智能手机708经由通信713从自主无人机710接收图像。智能手机708拍摄图像并将其发送至服务器706以供在社交媒体网站上发布,这可以是近乎实时的。服务器706可以托管自主无人机管理系统216。根据一些示例,诸如智能手机708的远程控制/主机装置通过经由通信713、712向自主无人机710发送指令来控制自主无人机710的状态。
[0141] 图8示出了根据一些示例的自主无人机710。从自主无人机710的仰视图示出自主无人机710。参照图6和图8,自主无人机710包括螺旋桨690、可以在顶部上的控制旋钮614、高度检测器660、电池608、摄影摄像装置650、指示灯612、连接器616、中心壳体(case)804、导航摄像装置651和飞行按钮806。充电/传送线缆802被插入到连接器616中。中心壳体804包括各种部件600,例如处理器604、存储器606、无线连接666等。在一些示例中,自主无人机710是塑料的,并且大约六英寸长和四英寸宽。在一些示例中,自主无人机710是四旋翼飞行器(quadrotor)。飞行按钮806是按钮618,其当被按压时指示自主无人机710应该起飞并执行飞行计划。根据一些实施方式,控制旋钮614的状态615选择图9的预编程的飞行计划960。
[0142] 图9示出了根据一些示例的用于全自主无人机飞行的系统900。导航系统916沿着飞行计划910指引自主无人机710。根据一些实施方式,导航系统916被存储在存储器606中并由处理器604执行。
[0143] 导航系统916基于预编程的飞行计划960生成飞行计划910。例如,预编程的飞行计划960是在距离用户的头部几英尺并在用户的头部上方飞行,并完成该人的360度视频。导航系统916必须确定符合预编程的飞行计划960的飞行计划910。
[0144] 示例预编程的飞行计划960包括要遵循的路径,诸如要环绕用户或对象、遵循用户或对象的周围或附近的预定路线,其中该路径可以被设计成捕获视频或照片,在用户的前面悬停,去目的地并返回,去目的地并环绕目的地以获取视频,跟随用户等。预编程的飞行计划960可以包括距与面部相关联的人的目标距离和自主无人机在地面上方的目标高度。
[0145] 传感器数据912是由传感器648和/或诸如无线连接666的其他部件600生成的数据。传感器数据912还包括关于输入/输出装置602的信息,例如控制旋钮614的状态615。推进系统命令914包括确定用于电动机686的电力和致动器638的位置。
[0146] 在一些示例中,导航系统916确定与时间936、方向950和位置952相关联的自主无人机速度934。自主无人机710的速度(velocity)是自主无人机速度(speed)934和方向950。在一些示例中,导航系统916使自主无人机710能够是完全自主的,其中自主无人机710起飞、飞行、降落以及可选地捕获图像或视频,而无需来自自主无人机710外部的电子控制装置的额外输入。
[0147] 在一些示例中,基于来自处于垂直位置的导航摄像装置651的图像,并且在一些示例中,还基于使用测高仪654或另一传感器648的高度估计来确定自主无人机速度934或速度。在一些示例中,使用利用传感器数据912的航位推算来确定自主无人机速度934或速度。本领域技术人员将认识到,可以以使用传感器数据912的其他方式确定自主无人机速度
934。风速由诸如风速传感器661的传感器直接确定,或者基于自主无人机710的预期速度与自主无人机710的实际速度相比的差来确定。在一些示例中,基于自主无人机710的定位的差来确定自主无人机710的速度,这可以基于由GPS芯片668生成的GPS定位。在一些示例中,基于诸如IEEE 802.11的无线协议来确定自主无人机710的定位,其中在自主无人机710与一个或更多个主机之间发送消息以确定自主无人机710的定位。在一些示例中,基于诸如智能手机708的主机的定位和关于自主无人机710距智能手机708的距离的信息来确定自主无人机710的定位,其可以与在地面上方的高度耦合以确定自主无人机710的定位的坐标。
[0148] 基于诸如来自导航摄像装置651、高度检测器660或另一部件600的传感器数据912来确定高度927。高度927与时间929相关联。可以以不同的方式确定自主无人机速度934和高度927。与高度927相关联的时间929、与自主无人机速度934相关联的时间936由时钟663生成。导航系统916包括状态972,其指示自主无人机710或导航系统916的目标或目的。参照图10,导航系统916的两个状态972包括“不飞行”1002和“飞行”1006。在一些示例中,当自主无人机710如果“飞行”1006时,自主无人机710进入降低的电力状态641。例如,由于自主无人机710不需要接收命令,因此可以关断无线连接666以及输入/输出装置602不用于导航或图像捕获。
[0149] 面部识别模块970识别面部。面部识别模块970基于神经网络、特征识别和放置或其他方法。在一些示例中,面部识别模块970在识别初始面部968之后,将初始面部968上传至诸如自主无人机管理系统216的服务器,该服务器训练神经网络以识别初始面部968中的面部,并将权重下载至自主无人机710,以使得在后续图像中识别初始面部968的过程更容易。
[0150] 面部识别模块970确定初始面部968。初始面部968可以包括不仅仅是人的面部,而且可以包括人的身体。解锁模块967基于传感器数据912解锁或释放自主无人机710。在一些示例中,解锁模块967接收飞行按钮806的选择的指示,并且作为响应,向摄影摄像装置650发送命令以捕获图像,该图像由面部识别模块970处理。如果面部识别模块970确定图像中存在合适的面部,那么解锁模块967解锁自主无人机710以进行飞行。起飞模块966被调用以开始飞行。在一些示例中,解锁模块967不接收来自外部电子控制的指示自主无人机710应该被解锁的命令。解锁模块967基于用户与自主无人机710的输入/输出装置602进行交互来解锁自主无人机710。
[0151] 起飞模块966执行用于自主无人机710的初始导航。起飞模块966发送推进系统命令914以根据初始飞行计划使自主无人机710升起到飞行中。导航飞行模块962确定飞行计划910,其基于预编程的飞行计划960。在一些示例中,预编程的飞行计划960基于控制旋钮614的状态615。
[0152] 导航飞行模块962基于接收传感器数据912和发送推进系统命令914来沿着飞行计划910导航自主无人机710。
[0153] 降落模块964在导航飞行模块962已经完成飞行计划910之后使自主无人机710降落。降落模块964发送推进系统命令914以使自主无人机710降落。在一些示例中,包括解锁模块967、起飞模块966、导航飞行模块962和降落模块964的导航系统916在没有来自外部电子装置或远程装置的任何附加指令或命令的情况下操作。例如,导航系统916接收来自人1106的起飞指令,但是没有接收指示降落地点的多个附加指令或一个附加指令,例如由人
1106将张开的手1214放置在自主无人机710下方。
[0154] 图10示出了根据一些实施方式的自主无人机的状态1000。自主无人机710在“不飞行”1002的状态972下启动。自主无人机710可以离开或处于自主无人机710不飞行的另一状态972。由自主无人机710接收“飞行指令”1004。在一些示例中,从自主无人机710的用户转动控制旋钮614或按压飞行按钮806开始接收“飞行指令”1004。自主无人机710可以通过例如以下方式执行检查以确保自主无人机710应该飞行:捕获图像并使用面部识别模块970来确保合适的初始面部968在经捕获的图像内。在“飞行”1006的状态972下,导航系统916导航自主无人机710。根据一些示例,“飞行”1006被分解成利用起飞模块966、导航飞行模块962和降落模块964的飞行阶段。自主无人机710在飞行结束1008处转换回至“不飞行”1002的状态972。
[0155] 图11示出了根据一些实施方式的解锁1100自主无人机。人1106按压飞行按钮806并将摄影摄像装置650指向他们的面部1102。面部识别模块970确定面部1102是否适合作为初始面部968,这基于面部1102距自主无人机710的距离1104。解锁模块967解锁自主无人机710并且将面部1102与飞行按钮806的按压的组合识别为“飞行指令”1004,其将自主无人机
710转换至“飞行”的状态972。
[0156] 图12示出了根据一些实施方式的自主无人机710飞行。图12是图11的延续,其中自主无人机710处于“飞行”的状态972。自主无人机710首先遵循导航至飞行计划1210的路径,其中起飞模块966导航自主无人机710。根据一些示例,导航飞行模块962基于飞行计划1206沿着实际飞行路径1208的路径导航自主无人机。飞行计划1206基于预编程的飞行计划960。导航飞行模块962保持摄影摄像装置650指向人1106,并且在一些示例中指向人1106的头部或面部1002。
[0157] 降落模块964沿着导航以降落1212的路径来导航自主无人机710。在一些示例中,降落模块964悬停在人1106的前面并等待手或其他对象被放置在自主无人机710下方的指示。例如,人1106的手臂可以最初已经处于手臂位置1202,但是人1106可能已经让他们的手臂下垂到他们的身旁。然后,人1106将他们的手臂移动回至手臂位置1202,手臂移动1204,自主无人机710检测到该手臂移动1204并向下降落在张开的手1214或张开的手1214的手掌上。例如,高度检测器660可以检测高度的大变化或者对象或手臂靠近自主无人机710的底部。在一些实施方式中,自主无人机710仅从自主无人机710起飞的时间开始接收人1106的手臂的移动,手臂移动1204的这种检测作为命令,直到自主无人机710降落在张开的手1214上为止。导航至飞行计划1210、实际飞行路径1208和导航以降落1212的整个飞行是在没有来自电子装置的外部命令的情况下全部执行的,并且在一些示例中,是在没有包括来自非电子装置的命令(例如语音或手势)的外部命令的情况下全部执行的。在一些示例中,可以仅从由人1106操作的自主无人机710的输入/输出装置602发起飞行。
[0158] 图13示出了根据一些实施方式的自主无人机降落1300。图13示出了导航以降落1212的路径的附加细节。降落模块964沿着从图11中再现的导航以降落1212的路径导航。人
1106站在地面1304上。降落模块964将自主无人机710导航至悬停1306位置,并等待使用高度传感器/摄像装置1302检测自主无人机710下方的张开的手1214。例如,人1106在自主无人机710下方移动他们的张开的手1214。根据一些示例,高度传感器/摄像装置1302是高度检测器660或导航摄像装置651。
[0159] 图14示出了根据一些示例的用于全自主无人机飞行的方法1400。方法1400在操作1402处开始,其中使用自主无人机的图像捕获装置捕获图像。例如,图11的自主无人机710使用摄影摄像装置650捕获图像。
[0160] 方法1400在操作1404处继续,其中处理图像以识别面部。例如,面部识别模块970处理图像以确定是否存在合适的初始面部968。
[0161] 方法1400在操作1406处继续,其中根据飞行计划进行导航,其中,飞行计划基于在由图像捕获装置捕获的后续图像中识别面部。例如,参照图12,导航飞行模块962通过用摄影摄像装置650捕获面部1002的图像来沿着实际飞行路径1208的路径导航自主无人机710。
[0162] 方法1400在操作1408处继续,其中导航自主无人机以降落。例如,参照图13,降落模块964沿着导航以降落1212的路径导航自主无人机710,并且悬停1306等待人1106举起他们的张开的手1214。在检测到张开的手1214之后,降落模块964导航自主无人机710降落在张开的手1214上,这可以仅减少至电动机686的电力,使得自主无人机710下降到张开的手1214中。
[0163] 方法1400可以由本文所讨论的一个或更多个设备或设备的装置单独地或彼此结合地执行。例如,自主无人机710、消息收发系统100、智能手机708、其他设备或设备的装置可以单独地或彼此结合地执行方法1400。方法1400的操作中的一个或更多个可以是可选的。方法1400可以包括一个或更多个附加操作。方法1400的一个或更多个操作可以以不同的顺序执行。
[0164] 机器架构
[0165] 图15是机器1500的图解表示,在该机器1500内可以执行用于使机器1500执行本文所讨论的方法中的任何一种或更多种的指令1510(例如,软件、程序、应用、小程序、app或其他可执行代码)。例如,指令1510可以使机器1500执行本文所描述的方法中的任何一种或更多种。指令1510将通用的未经编程的机器1500转换成被编程为以所描述的方式执行所描述和所示出的功能的特定机器1500。机器1500可以作为独立装置操作,或者可以耦接(例如,联网)至其他机器。在网络部署中,机器1500可以在服务器‑客户端网络环境中以服务器机器或客户端机器的身份操作,或者在对等(或分布式)网络环境中作为对等机器操作。机器1500可以包括但不限于:服务器计算机、客户端计算机、个人计算机(PC)、平板计算机、膝上型计算机、上网本、机顶盒(STB)、个人数字助理(PDA)、娱乐媒体系统、蜂窝电话、智能手机、移动装置、可穿戴装置(例如,智能手表)、智能家居装置(例如,智能电器)、其他智能装置、web装置、网络路由器、网络交换机、网络桥接器或能够顺序地或以其他方式执行指定要由机器1500采取的动作的指令1510的任何机器。此外,虽然仅示出了单个机器1500,但是术语“机器”还应当被视为包括单独地或联合地执行指令1510以执行本文中讨论的方法中的任何一种或更多种方法的机器的集合。例如,机器1500可以包括客户端装置102或者形成消息收发服务器系统108的一部分的多个服务器装置中的任何一个。在一些示例中,机器1500还可以包括客户端系统和服务器系统两者,其中特定方法或算法的某些操作在服务器侧执行,并且所述特定方法或算法的某些操作在客户端侧执行。
[0166] 机器1500可以包括处理器1504、存储器1506和输入/输出I/O部件1502,所述处理器1504、存储器1506和输入/输出I/O部件1502可以被配置成经由总线1540彼此通信。在示例中,处理器1504(例如,中央处理单元(CPU)、精简指令集计算(RISC)处理器、复杂指令集计算(CISC)处理器、图形处理单元(GPU)、数字信号处理器(DSP)、专用集成电路(ASIC)、射频集成电路(RFIC)、其他处理器或其任何合适的组合)可以包括例如执行指令1510的处理器1508和处理器1512。术语“处理器”旨在包括多核处理器,所述多核处理器可以包括可以同时执行指令的两个或更多个独立的处理器(有时被称为“核”)。尽管图15示出了多个处理器1504,但是机器1500可以包括具有单个核的单个处理器、具有多个核的单个处理器(例如,多核处理器)、具有单个核的多个处理器、具有多个核的多个处理器、或者其任何组合。
[0167] 存储器1506包括主存储器1514、静态存储器1516和存储单元1518,所述主存储器1514、静态存储器1516和存储单元1518均可由处理器1504经由总线1540访问。主存储器
1506、静态存储器1516和存储单元1518存储实现本文所述的方法或功能中的任何一种或更多种的指令1510。指令1510还可以在其由机器1500执行期间完全地或部分地驻留在主存储器1514内、静态存储器1516内、存储单元1518内的机器可读介质1520内、处理器1504中的至少一个处理器内(例如,在处理器的高速缓存存储器内)或者其任何合适的组合内。
[0168] I/O部件1502可以包括接收输入、提供输出、产生输出、发送信息、交换信息、捕获测量结果等的各种部件。包括在特定机器中的特定I/O部件1502将取决于机器的类型。例如,便携式机器例如移动电话可以包括触摸输入装置或其他这样的输入机构,而无头(headless)服务器机器将不太可能包括这样的触摸输入装置。应当认识到,I/O部件1502可以包括图15中未示出的许多其他部件。在各种示例中,I/O部件1502可以包括用户输出部件1526和用户输入部件1528。用户输出部件1526可以包括视觉部件(例如,诸如等离子显示面板(PDP)、发光二极管(LED)显示器、液晶显示器(LCD)、投影仪或阴极射线管(CRT)的显示器)、声学部件(例如,扬声器)、触觉部件(例如,振动马达、阻力机构)、其他信号生成器等。
用户输入部件1528可以包括字母数字输入部件(例如,键盘、被配置成接收字母数字输入的触摸屏、光学键盘或其他字母数字输入部件)、基于点的输入部件(例如,鼠标、触摸板、轨迹球、操纵杆、运动传感器或其他指向仪器)、触觉输入部件(例如,物理按钮、提供触摸或触摸姿势的定位和力的触摸屏或其他触觉输入部件)、音频输入部件(例如,麦克风)等。
[0169] 在其他示例中,I/O部件1502可以包括生物计量部件1530、运动部件1532、环境部件1534或位置部件1536以及广泛的一系列其他部件。例如,生物计量部件1530包括用于检测表达(例如,手表达、面部表达、声音表达、身体姿势或眼睛跟踪)、测量生物信号(例如,血压、心率、体温、出汗或脑波)、识别人(例如,声音识别、视网膜识别、面部识别、指纹识别或基于脑电图的识别)等的部件。运动部件1532包括加速度传感器部件(例如,加速度计)、重力传感器部件、旋转传感器部件(例如,陀螺仪)。
[0170] 环境部件1534包括例如一个或更多个摄像装置(具有静止图像/照片和视频能力)、照明传感器部件(例如,光度计)、温度传感器部件(例如,检测环境温度的一个或更多个温度计)、湿度传感器部件、压力传感器部件(例如,气压计)、声学传感器部件(例如,检测背景噪声的一个或更多个麦克风)、接近传感器部件(例如,检测附近对象的红外传感器)、气体传感器(例如,用于出于安全而检测危险气体的浓度或用于测量大气中的污染物的气体检测传感器)或者可以提供与周围物理环境对应的指示、测量结果或信号的其他部件。
[0171] 关于摄像装置,客户端装置102可以具有摄像装置系统,该摄像装置系统包括例如在客户端装置102的前表面上的前置摄像装置和客户端装置102的后表面上的后置摄像装置。前置摄像装置可以例如用于捕获客户端装置102的用户的静止图像和视频(例如,“自拍”),然后可以用上述增强数据(例如,过滤器)对该静止图像和视频进行增强。后置摄像装置可以例如用于以更传统的摄像装置模式捕获静止图像和视频,其中这些图像类似地利用增强数据进行增强。除了前置摄像装置和后置摄像装置之外,客户端装置102还可以包括用于捕获360°照片和视频的360°摄像装置。
[0172] 此外,客户端装置102的摄像装置系统可以包括双后置摄像装置(例如,主摄像装置以及深度感测摄像装置),或者甚至在客户端装置102的前后侧上包括三重、四重或五重后置摄像装置配置。例如,这些多摄像装置系统可以包括广角摄像装置、超广角摄像装置、远距摄像装置、微距摄像装置和深度传感器。
[0173] 位置部件1536包括定位传感器部件(例如,GPS接收器部件)、海拔传感器部件(例如,检测气压的高度计或气压计,根据该气压可以得到海拔)、取向传感器部件(例如,磁力计)等。
[0174] 可以使用各种各样的技术来实现通信。I/O部件1502还包括通信部件1538,通信部件1538可操作以经由相应的耦接或连接将机器1500耦接至网络1522或装置1524。例如,通信部件1538可以包括与网络1522对接的网络接口部件或其他合适的装置。在其他示例中,通信部件1538可以包括有线通信部件、无线通信部件、蜂窝通信部件、近场通信(NFC)部件、部件(例如, 低能耗)、 部件、和用于经由其他模态提供通信的其他通信部件。装置1524可以是其他机器或各种各样的外围装置中的任何外围装置(例如,经由USB耦接的外围装置)。
[0175] 此外,通信部件1538可以检测标识符或包括可操作以检测标识符的部件。例如,通信部件1538可以包括射频识别(RFID)标签阅读器部件、NFC智能标签检测部件、光学阅读器部件(例如,用于检测诸如通用产品码(UPC)条形码的一维条形码、诸如快速响应(QR)码、Aztec码、数据矩阵、数据符号(Dataglyph)、最大码(MaxiCode)、PDF417、超码(Ultra Code)、UCC RSS‑2D条形码的多维条形码和其他光学码的光学传感器)或者声学检测部件(例如,用于识别标记的音频信号的麦克风)。另外,可以经由通信部件1538得到各种信息,例如经由因特网协议(IP)地理定位得到定位、经由 信号三角测量得到定位、经由检测可以指示特定定位的NFC信标信号得到定位等。
[0176] 各种存储器(例如,主存储器1514、静态存储器1516以及处理器1504的存储器)以及存储单元1518可以存储由本文中描述的方法或功能中的任何一种或更多种使用或实施本文中描述的方法或功能中的任何一种或更多种的一组或更多组指令和数据结构(例如,软件)。在由处理器1504执行的情况下,这些指令(例如,指令1510)使各种操作实现所公开的示例。
[0177] 可以经由网络接口装置(例如,通信部件1538中包括的网络接口部件)使用传输介质并且使用若干公知的传输协议中的任何一个传输协议(例如,超文本传输协议(HTTP))通过网络1522来发送或接收指令1510。类似地,可以使用传输介质经由至装置1524的耦接(例如,对等耦接)来发送或接收指令1510。
[0178] 软件架构
[0179] 图16是示出可以安装在本文中描述的装置中的任何一个或更多个装置上的软件架构1604的框图1600。软件架构1604由硬件诸如包括处理器1620、存储器1626和I/O部件1638的机器1602支持。在该示例中,软件架构1604可以被概念化为层的堆栈,其中每个层提供特定功能。软件架构1604包括下述层,例如操作系统1612、库1610、框架1608和应用1606。
在操作上,应用1606通过软件堆栈来激活API调用1650并且响应于API调用1650而接收消息
1652。
[0180] 操作系统1612管理硬件资源并提供公共服务。操作系统1612包括例如:核1614、服务1616以及驱动器1622。核1614用作硬件与其他软件层之间的抽象层。例如,核1614提供存储器管理、处理器管理(例如,调度)、部件管理、联网和安全设置等功能。服务1616可以针对其他软件层提供其他公共服务。驱动器1622负责控制底层硬件或与底层硬件对接。例如,驱动器1622可以包括显示驱动器、摄像装置驱动器、 或低能耗驱动器、闪存驱动器、串行通信驱动器(例如,USB驱动器)、
驱动器、音频驱动器、电力管理驱动器等。
[0181] 库1610提供由应用1606使用的共同低级基础设施。库1610可以包括系统库1618(例如,C标准库),该系统库1618提供诸如存储器分配功能、字符串操纵功能、数学功能等的功能。此外,库1610可以包括API库1624,例如媒体库(例如,用于支持各种媒体格式的呈现和操纵的库,所述各种媒体格式例如运动图像专家组‑4(MPEG4)、高级视频编码(H.264或AVC)、运动图像专家组层‑3(MP3)、高级音频编码(AAC)、自适应多速率(AMR)音频编解码器、联合图像专家组(JPEG或JPG)或便携式网络图形(PNG))、图形库(例如,用于在显示器上的图形内容中以二维(2D)和三维(3D)进行渲染的OpenGL框架)、数据库库(例如,提供各种关系数据库功能的SQLite)、web库(例如,提供web浏览功能的WebKit)等。库1610还可以包括各种其他库1628,以向应用1606提供许多其他API。
[0182] 框架1608提供由应用1606使用的共同高级基础设施。例如,框架1608提供各种图形用户界面(GUI)功能、高级资源管理和高级定位服务。框架1608可以提供可以由应用1606使用的广泛的其他API,其中一些API可以特定于特定操作系统或平台。
[0183] 在示例中,应用1606可以包括家庭应用1636、联系人应用1630、浏览器应用1632、书籍阅读器应用1634、定位应用1642、媒体应用1644、消息收发应用1646、游戏应用1648和诸如第三方应用1640的广泛分类的其他应用。自主无人机管理1641系统管理如本文中并且结合自主无人机管理系统216公开的自主无人机。应用1606是执行程序中定义的功能的程序。可以采用各种编程语言来创建以各种方式构造的应用1606中的一个或更多个,所述编程语言例如面向对象的编程语言(例如,Objective‑C、Java或C++)或过程编程语言(例如,C或汇编语言)。在特定示例中,第三方应用1640(例如,由特定平台的供应商以外的实体使用TM TM TMANDROID 或IOS 软件开发工具包(SDK)开发的应用)可以是移动操作系统,例如IOS 、TM
ANDROID 、 Phone、或其他移动操作系统上运行的移动软件。在该示例中,第三方应用1640可以激活由操作系统1612提供的API调用1650以便于本文中描述的功能。
[0184] 处理部件
[0185] 现在转至图17,示出了处理环境1700的图解表示,其包括处理器1702、处理器1706和处理器1708(例如,GPU、CPU或其组合)。
[0186] 处理器1702被示出成耦接至电源1704,并且被示出为包括(永久配置的或临时实例化的)模块,即起飞部件1710、导航部件1712和降落部件1714。起飞部件1710控制自主无人机起飞。例如,根据一些示例,起飞部件1710执行结合起飞模块966所描述的功能,包括响应于手势的检测。导航部件1712执行与根据飞行计划910导航自主无人机有关的功能。降落部件1714管理自主无人机的降落并执行结合降落模块964所公开的功能。降落部件1714检测悬停并且检测手或对象何时被放置在自主无人机710下方。根据一些示例,处理器1702是专门为自主无人机710设计的专用处理器1702。在一些示例中,处理器1702是具有运行诸如的实时操作系统的处理器1702的主板的一部分。处理器1702与包括在自主无人机710中的其他处理电路系统(例如部件600)通信。
[0187] 术语表
[0188] “载波信号”是指能够存储、编码或携载由机器执行的指令并且包括数字或模拟通信信号的任何无形介质或有助于这样的指令的通信的其他无形介质。可以经由网络接口装置使用传输介质在网络上发送或接收指令。
[0189] “客户端装置”是指与通信网络对接以从一个或更多个服务器系统或其他客户端装置获得资源的任何机器。客户端装置可以是但不限于移动电话、桌上型计算机、膝上型计算机、便携式数字助理(PDA)、智能手机、平板计算机、超级本、上网本、膝上型计算机、多处理器系统、基于微处理器或可编程的消费电子产品、游戏控制台、机顶盒或用户可以用于访问网络的任何其他通信装置。
[0190] “通信网络”是指网络的一个或更多个部分,该网络可以是自组织网络、内联网、外联网、虚拟专用网络(VPN)、局域网(LAN)、无线LAN(WLAN)、广域网(WAN)、无线WAN(WWAN)、城域网(MAN)、因特网、因特网的一部分、公共交换电话网(PSTN)的一部分、普通老式电话服务(POTS)网络、蜂窝电话网络、无线网络、 网络、其他类型的网络或者两个或更多个这样的网络的组合。例如,网络或网络的一部分可以包括无线网络或蜂窝网络,并且耦接可以是码分多址(CDMA)连接、全局移动通信系统(GSM)连接或其他类型的蜂窝或无线耦接。在该示例中,耦接可以实现各种类型的数据传送技术中的任何数据传输技术,例如单载波无线电传输技术(1xRTT)、演进数据优化(EVDO)技术、通用分组无线电服务(GPRS)技术、增强型数据速率GSM演进(EDGE)技术、包括3G的第三代合作伙伴计划(3GPP)、第四代无线(4G)网络、通用移动电信系统(UMTS)、高速分组接入(HSPA)、全球微波接入互操作性(WiMAX)、长期演进(LTE)标准、由各种标准设置组织定义的其他数据传输技术、其他长距离协议或其他数据传输技术。
[0191] “部件”是指装置、物理实体或具有由功能或子例程调用、分支点、API或者对特定处理或控制功能提供分区或模块化的其他技术来定义的边界的逻辑。部件可以经由它们的接口与其他部件组合以执行机器处理。部件可以是被设计用于与其他部件一起使用的经封装的功能硬件单元并且可以是通常执行相关功能中的特定功能的程序的一部分。部件可以构成软件部件(例如,在机器可读介质上实施的代码)或硬件部件。“硬件部件”是能够执行某些操作的有形单元,并且可以以某种物理方式来配置或布置。在各种示例中,可以通过软件(例如,应用或应用部分)将一个或更多个计算机系统(例如,独立计算机系统、客户端计算机系统或服务器计算机系统)或计算机系统的一个或更多个硬件部件(例如,处理器或处理器组)配置为进行操作以执行本文中描述的某些操作的硬件部件。也可以机械地、电子地或其任何合适的组合来实现硬件部件。例如,硬件部件可以包括被永久地配置成执行某些操作的专用电路系统或逻辑。硬件部件可以是专用处理器,例如现场可编程门阵列(FPGA)或专用集成电路(ASIC)。硬件部件还可以包括通过软件被短暂地配置成执行某些操作的可编程逻辑或电路系统。例如,硬件部件可以包括由通用处理器或其他可编程处理器执行的软件。一旦通过这样的软件被配置,则硬件部件成为被独特地定制成执行所配置的功能的特定机器(或机器的特定部件),而不再是通用处理器。应当理解,可以出于成本和时间考虑来决定是机械地在专用且永久配置的电路系统中实现硬件部件还是在临时配置(例如,由软件配置)的电路系统中实现硬件部件。因此,短语“硬件部件”(或“硬件实现的部件”)应当被理解成包含有形实体,即被物理构造、永久配置(例如,硬连线)或临时配置(例如,编程)成以某种方式操作或者执行本文中描述的某些操作的实体。考虑硬件部件被临时配置(例如,被编程)的示例,无需在任一时刻对硬件部件中的每一个进行配置或实例化。例如,在硬件部件包括通过软件配置成变成专用处理器的通用处理器的情况下,该通用处理器可以在不同时间处被分别配置成不同的专用处理器(例如,包括不同的硬件部件)。软件相应地将一个或多个特定处理器配置成例如在一个时刻处构成特定硬件部件,并且在不同的时刻处构成不同的硬件部件。硬件部件可以向其他硬件部件提供信息并且从其他硬件部件接收信息。相应地,所描述的硬件部件可以被认为是通信上耦接的。在同时存在多个硬件部件的情况下,可以通过在硬件部件中的两个或更多个硬件部件之间或之中的信号传输(例如,通过适当的电路和总线)来实现通信。在其中多个硬件部件在不同时间处被配置或被实例化的示例中,可以例如通过将信息存储在多个硬件部件可以访问的存储器结构中并且在该存储器结构中检索信息来实现这样的硬件部件之间的通信。例如,一个硬件部件可以执行操作,并且将该操作的输出存储在与其通信地耦接的存储器装置中。然后,其他硬件部件可以在随后的时间处访问该存储器装置以检索所存储的输出并对其进行处理。硬件部件还可以发起与输入装置或输出装置的通信,并且可以对资源(例如,信息的集合)进行操作。在本文所描述的示例方法的各种操作可以至少部分地由临时地配置(例如,由软件)或永久地配置以执行相关操作的一个或更多个处理器来执行。无论是被临时地配置还是永久地配置,这样的处理器可以构成进行操作以执行本文中所描述的一个或更多个操作或功能的处理器实现的部件。如本文所使用的,“处理器实现的部件”是指使用一个或更多个处理器实现的硬件部件。类似地,本文中所描述的方法可以至少部分地由处理器实现,其中,特定的一个或多个处理器是硬件的示例。例如,方法的操作中的至少一些操作可以由一个或更多个处理器或处理器实现的部件来执行。此外,一个或更多个处理器还可以进行操作以支持“云计算”环境中的相关操作的执行或作为“软件即服务”(SaaS)操作。例如,操作中的至少一些操作可以由一组计算机(作为包括处理器的机器的示例)执行,其中,这些操作能够经由网络(例如,因特网)并且经由一个或更多个适当的接口(例如,API)进行访问。操作中的某些操作的执行可以分布在处理器之间,不仅可以驻留在单个机器内,而且可以跨多个机器部署。在一些示例中,处理器或处理器实现的部件可以位于单个地理定位中(例如,在家庭环境、办公室环境或服务器群内)。在其他示例中,处理器或处理器实现的部件可以跨多个地理定位分布。
[0192] “计算机可读存储介质”是指机器存储介质和传输介质两者。因此,这些术语包括存储装置/介质和载波/调制数据信号两者。术语“机器可读介质”、“计算机可读介质”和“装置可读介质”意指相同的事物,并且可以在本公开内容中可交换地使用。
[0193] “短暂消息”是指在时间受限的持续时间内可访问的消息。短暂消息可以是文本、图像、视频等。针对短暂消息的访问时间可以由消息发送者设置。替选地,访问时间可以是默认设置或者由接收方指定的设置。无论设置技术如何,该消息都是暂态的。
[0194] “机器存储介质”是指存储可执行指令、例程和数据的单个或多个存储装置和介质(例如,集中式或分布式数据库,以及相关联的缓存和服务器)。因此,该术语应当被视为包括但不限于固态存储器以及光学和磁介质,包括处理器内部或外部的存储器。机器存储介质、计算机存储介质和装置存储介质的具体示例包括:非易失性存储器,包括例如半导体存储器装置,例如可擦除可编程只读存储器(EPROM)、电可擦除可编程只读存储器(EEPROM)、FPGA和闪存装置;磁盘,例如内部硬盘和可移除盘;磁光盘;以及CD‑ROM和DVD‑ROM盘。术语“机器存储介质”、“装置存储介质”、“计算机存储介质”意指相同的事物并且可以在本公开内容中互换地使用。术语“机器存储介质”、“计算机存储介质”和“装置存储介质”明确地排除了载波、调制数据信号和其他这样的介质(其中的至少一些被涵盖在术语“信号介质”中)。
[0195] “非暂态计算机可读存储介质”是指能够存储、编码或携载由机器执行的指令的有形介质。
[0196] “信号介质”是指能够存储、编码或携载由机器执行的指令的任何无形介质并且包括数字或模拟通信信号或有助于软件或数据的通信的其他无形介质。术语“信号介质”应当被视为包括任何形式的调制数据信号、载波等。术语“调制数据信号”意指其各个特性中的一个或更多个特性以将信息编码在该信号中的方式来设置或改变的信号。术语“传输介质”和“信号介质”意指相同的事物并且可以在本公开内容中可互换地使用。

当前第1页 第1页 第2页 第3页