技术领域
[0001] 本申请的实施例总体涉及网络,更具体地涉及对多媒体内容的访问。
相关背景技术
[0002] 多媒体可以包括使用不同内容媒体形式(例如文本、音频、图像、动画、视频和交互内容)的组合的内容。多媒体可以与仅使用基本计算机显示的其他媒体有所不同,例如纯文本或传统形式的印刷或手工制作的材料。多媒体可以被记录、播放、显示、与信息内容处理设备(诸如,计算机化的和电子的设备)交互或由其访问。
具体实施方式
[0025] 示例实现方式的以下具体描述参照附图。不同附图中的相同标号可以标识相同或者相似要素。
[0026] 多媒体内容调节可以由策略来控制。例如,策略可以限制对特定多媒体内容(例如,暴力内容、与特定评级相关联的内容、冒犯性内容等)的访问,可以基于试图访问多媒体内容的客户端用户的年龄、位置等来限制访问,等等。在一些情况下,组织和/或个人可能缺乏基于计算机的技术,该技术用于自动分析多媒体内容,并基于与多媒体内容有关的策略来确定客户端设备的用户是否被允许访问该多媒体内容。
[0027] 本文描述的一些实现方式提供了多媒体分析平台,其能够自动地分析多媒体内容,并且确定策略是否允许特定用户访问该多媒体内容(例如,基于用户的年龄、用户的位置、多媒体内容的类型等)。以这种方式,多媒体分析平台可以自动并动态地实施与内容有关的策略。这改善了策略对多媒体内容的应用,和/或提高了将策略应用于多媒体内容的效率。另外,这节省了由于内容审查效率低下而消耗的处理资源。此外,这允许审查不能由人类行动者手动或客观处理的内容量,或不能由人类行动者在阈值时间量内处理的内容量。
[0028] 图1A-1G是本文描述的示例实现方式100的概览的示图。实现方式100包括多媒体分析平台和客户端设备(如图1G所示)。本文关于图1A-1G描述的实现方式可以用于相对于数百、数千、数百万等与内容有关的策略来处理数千、数百万、数十亿等多媒体数据元素。以这种方式,多媒体分析平台可以处理不能由人类行动者手动或客观处理的数据集。另外,虽然实现方式100示出了单个客户端设备,但实际上,可能有数百、数千、数百万等客户端设备与多媒体分析平台通信。
[0029] 如图1A和附图标记102所示,多媒体分析平台可以接收与多媒体内容有关的多媒体数据,与多媒体内容和/或多媒体内容将被提供给的用户相关联的元数据,和/或与限制对特定多媒体内容的访问和/或限制由特定用户访问的策略有关的策略数据。例如,多媒体分析平台可以接收指示沙特阿拉伯可用的多媒体数据不能包含裸露的策略数据(例如,示出为“沙特阿拉伯:无裸露”)。又如,多媒体分析平台可以接收指示在法国包含战争场景的可用多媒体数据不能被12岁以下的任何人访问的策略数据(例如,示出为“法国:战争场景不适于12岁以下”)。作为又一示例,多媒体分析平台可以接收指示在爱尔兰包含战争场景的可用多媒体数据不能被18岁以下的任何人访问的策略数据(例如,示出为“爱尔兰:战争场景不适于18岁以下”)。
[0030] 多媒体分析平台可以接收的多媒体数据可以包括音频(其包括在篮球比赛中欢呼的拉拉队)、篮球比赛的视频和/或类似物。附加地或备选地,多媒体分析平台接收的元数据可以包括标识请求多媒体数据的用户的元数据(例如,请求多媒体数据的客户端设备(图1A中未示出)的互联网协议(IP)地址、与请求多媒体数据的用户相关联的用户名、请求多媒体内容的客户端设备的设备名称等)。
[0031] 如附图标记104所示,多媒体分析平台可以使用第一技术集来处理策略数据,以标识与策略相关联的术语集和/或短语集。例如,多媒体分析平台可以使用自然语言处理技术、计算语言学技术、文本分析技术和/或类似物来标识在策略数据中包括的术语集和/或短语集。
[0032] 如附图标记106所示,多媒体分析平台可以标识指示去往定位在沙特阿拉伯的客户端设备的多媒体数据不能包含裸露的术语集和/或短语集。例如,术语和/或短语可以包括“沙特阿拉伯:无裸露”。
[0033] 如附图标记108所示,多媒体分析平台可以标识指示去往定位在法国并且与12岁以下的用户相关联的客户端设备的多媒体数据不能包含战争场景的术语集和/或短语集。例如,术语和/或短语可以包括“法国:战争场景下不适于12岁以下。”
[0034] 如图1B和附图标记110所示,多媒体分析平台可以在标识该术语集和/或短语集之后确定针对该术语集和/或短语集的第一嵌入集。在一些实现方式中,多媒体分析平台可以使用诸如Word2Vec技术的技术来确定针对该术语集和/或短语集的第一嵌入集。
[0035] 针对策略数据中所标识的术语集和/或短语集来确定第一嵌入集之前,多媒体分析平台可以标识与策略数据中所标识的术语集和/或短语集在语义上类似的术语集和/或短语集。例如,多媒体分析平台可以使用WordNet、BabelNet等来标识与策略数据中所标识的术语集和/或短语集类似的术语集和/或短语集。这允许多媒体分析平台能够更智能地确定与策略相关联的限制,相对于无法标识语义上相似的术语和/或短语。
[0036] 如附图标记112所示,嵌入集可以包括概念的数值多维表示。例如,在嵌入中包括的数字可以指示概念(例如女人或枪)与其他概念的维度(例如,裸露、暴力、年龄)相关联的可能性,其中较高的数字相对于较低的数字表示更高的可能性。例如,多媒体数据中存在的术语“枪”可能与各种维度的暴力(例如,0.7;0.8;0.4;和0.6)高度相关(例如,大于阈值(诸如0.5)的可能性),而与裸露并不高度相关(例如,0.0;0.0;和0.0)。又如,多媒体数据中存在的术语“女人”可能与各种维度的裸露(例如,0.8;0.6;和0.4)高度相关(例如,大于阈值(如0.5)的可能性),并且与年龄(例如,0.2;0.3;和0.3)并不高度相关。以这种方式,多媒体分析平台可以确定多媒体数据中概念(例如,枪)的存在是否可能违反策略中的概念(例如,禁止在多媒体内容中包括的暴力)。
[0037] 如图1C并且通过附图标记114所示,多媒体分析平台可以使用第二技术集来处理多媒体数据和/或元数据,以确定标识多媒体数据和/或元数据的第二嵌入集。基于多媒体分析平台正在处理的数据的类型,多媒体分析平台处理多媒体数据和/或元数据的方式可以不同。
[0038] 如附图标记116所示,多媒体分析平台可以处理在多媒体数据中包括的音频数据。多媒体分析平台可以处理音频数据以从音频数据提取音频序列,并且可以使用递归神经网络处理音频序列以标识在音频数据中包括的声音。例如,多媒体分析平台可以标识音频数据中的女性声音(例如,拉拉队),音频数据包括叫喊等。
[0039] 如附图标记118所示,多媒体分析平台可以确定用于在音频数据中标识的声音的嵌入集。在一些实现方式中,该嵌入集可以标识与女性有关的声音(例如,0.7;0.8;和0.6)以及与叫喊有关的声音(例如,0.4;0.0;和0.0)有关的各种维度指示在多媒体数据中存在拉拉队的可能性。
[0040] 如附图标记120所示,多媒体分析平台可以处理元数据。在一些实现方式中,多媒体分析平台可以使用自然语言处理、文本分析、计算语言学和/或类似物来处理元数据,以标识在元数据中包括的术语集和/或短语集。例如,多媒体分析平台可以标识在元数据中包括的IP地址(例如,IP地址:124.0.0.1)、设备名称和/或类似物。
[0041] 如附图标记122所示,多媒体分析平台可以确定针对在元数据中包括的术语集和/或短语集的嵌入集。该嵌入集可以标识与阿拉伯地区有关的各种维度(例如,0.7;0.8;和0.6)并且与除阿拉伯地区以外的地区有关的各种维度(例如,0.4和0.0)指示IP地址(例如,IP地址124.0.0.1)标识多媒体数据去往的、位于沙特阿拉伯的客户端设备的可能性。
[0042] 如图1D和附图标记124所示,多媒体分析平台可以处理在多媒体数据中包括的视频数据。多媒体分析平台可以从视频数据中提取视频序列,和/或可以从视频序列中提取帧。例如,多媒体分析平台可以使用卷积神经网络、运动提取模型、递归神经网络和/或类似物来处理视频序列和/或帧,以标识帧和/或视频序列中的对象、在帧和/或视频序列中示出的动作和/或类似物。例如,如所示,多媒体分析平台可以在视频数据中标识在帧和/或视频序列中示出的篮球弹跳、人跑步和/或类似物。
[0043] 如附图标记126所示,多媒体分析平台可以确定针对在视频数据中所标识的对象、运动、动作和/或类似物的嵌入集。该嵌入集可以标识篮球弹跳(例如,0.7;0.8;0.6;和0.4)和人跑步(例如,0.1;0.0;0.0;和0.0)指示视频数据中示出的篮球比赛的可能性。
[0044] 如图1E和附图标记128所示,多媒体分析平台可以使用知识图来处理第一嵌入集和/或第二嵌入集,以确定多媒体内容和/或用户的访问是否违反了策略。例如,多媒体分析平台可以使用知识图来标识在多媒体数据、元数据和策略数据之间的匹配(例如,以标识违反或遵守与内容有关的策略的多媒体内容和/或对多媒体内容的尝试访问)。
[0045] 如附图标记130所示,当处理第一嵌入集和/或第二嵌入集时,多媒体分析平台可以标识与第一嵌入集和/或第二嵌入集相关联的术语集和/或短语集。在一些实现方式中,对于第一嵌入集,多媒体分析平台可以标识术语“裸露”和“年龄”。对于第二嵌入集,多媒体分析平台可以标识术语“篮球弹跳”和“人跑步”。
[0046] 如附图标记132所示,多媒体分析平台可以确定针对关于第一嵌入集和第二嵌入集所标识的术语集和/或短语集的分数。当确定该术语集和/或短语集的分数时,多媒体分析平台可以确定与每个术语和/或短语相关联的维度的可能性的平均分数。例如,多媒体分析平台可以确定针对与术语“裸露”相关联的维度的可能性的平均分数为0.6,针对与术语“年龄”相关联的维度的可能性的平均分数为0.3,针对与术语“篮球弹跳”相关联的维度的可能性的平均分数为0.7,以及针对与术语“人跑步”相关联的维度的可能性的平均分数为0.1。
[0047] 如附图标记134所示,多媒体分析平台可以标识具有阈值分数的术语和/或短语。例如,多媒体分析平台可以标识阈值分数为0.5的术语(例如,“裸露”和“篮球弹跳”)。以这种方式,多媒体分析平台可以标识具有标识多媒体内容、元数据和/或策略的最高概率的术语集和/或短语集(例如,相对于与第一嵌入集和/或第二嵌入集相关联的其它术语和/或短语)。
[0048] 如图1F和附图标记136所示,多媒体分析平台可以利用与第一嵌入集和/或第二嵌入集相关联的术语和/或短语来填充知识图。与多媒体分析平台使用的第一嵌入集和/或第二嵌入集相关联的术语和/或短语可以是具有阈值分数的术语。
[0049] 如图1G和附图标记138所示,多媒体分析平台可以标识用于填充知识图的术语和/或短语的共有边。标识边可以允许多媒体分析平台确定标识多媒体内容和/或针对多媒体内容的目的地的术语和/或短语是否匹配与策略相关联的术语和/或短语(例如,相对于其他术语和/或短语)。如所示,多媒体分析平台可以确定与多媒体内容和/或元数据(例如,“篮球”、“拉拉队”和“女孩”)相关联的术语和/或短语不违反对应的基于内容的策略(例如,基于确定多媒体内容不包括“裸露”)。
[0050] 如附图标记140所示,多媒体分析平台可以基于处理第一嵌入集和/或第二嵌入集的结果来执行动作。例如,多媒体分析平台可以生成标识对多媒体数据、元数据和/或策略数据的分析结果的报告。
[0051] 如附图标记142所示,多媒体分析平台可以向客户端设备提供多媒体内容(例如,基于确定多媒体内容不违反应用于多媒体内容和/或对多媒体内容的访问的策略)。多媒体分析平台可以将多媒体内容提供给客户端设备,以经由客户端设备进行显示。
[0052] 以这种方式,多媒体分析平台可以自动并动态地实施与内容有关的策略。这改善了策略对于多媒体内容的应用和/或提高了将策略应用于多媒体内容的效率。此外,这节省了由于内容审查效率低下而消耗的处理资源。此外,这允许审查不能由人类行动者手动或客观处理的内容量,或不能由人类行动者在阈值时间量内处理的内容量。
[0053] 如以上所指示的,图1A-1G仅被提供作为示例。其它示例是有可能的并且可以不同于关于图1A-1G而被描述的示例。
[0054] 图2是可以在其中实施本文描述的系统和/或方法的示例环境200的示图。如图2所示,环境200可以包括客户端设备210、服务器设备220、在包括计算资源集234的云计算环境232内提供的多媒体分析平台230、以及网络240。环境200的设备可以经由有线连接、无线连接或者有线连接和无线连接的组合来互连。
[0055] 客户端设备210包括能够接收、生成、存储、处理和/或提供与多媒体内容、与多媒体内容有关的策略和/或多媒体内容的目的地相关联的信息的一个或多个设备。例如,客户端设备210可以包括台式计算机、移动电话(例如,智能电话或无线电话)、膝上型计算机、平板计算机、游戏设备、可穿戴通信设备(例如,智能手表或者一副智能眼镜)或类似类型的设备。在一些实现方式中,客户端设备210可以提供与试图访问多媒体内容的客户端设备210的用户有关的数据,如本文其他地方所述。附加地或备选地,客户端设备210可以接收标识由多媒体分析平台230执行的分析的结果的信息(例如,被提供用于显示),如本文其他地方所述。虽然在图2中示出了单个客户端设备210,但实际上,可以有数百、数千、数百万等的客户端设备210与多媒体分析平台230通信。
[0056] 服务器设备220包括能够接收、生成、存储、处理和/或提供与多媒体内容、与多媒体内容有关的策略和/或多媒体内容的目的地相关联的信息的一个或多个设备。例如,服务器设备220可以包括服务器(例如,在数据中心或云计算环境中)、数据中心(例如,多服务器微数据中心)、工作站计算机、设置在云计算环境中的虚拟机(VM)或类似类型的设备。在一些实现方式中,服务器设备220可以向多媒体分析平台230提供与多媒体内容相关联的策略有关的信息,如本文其他地方所述。附加地或备选地,服务器设备220可以存储与由多媒体分析平台230执行的分析的结果有关的信息(例如,以促进机器学习来改善未来对多媒体内容的分析和/或其他多媒体分析平台230的分析),如本文其他地方所述。虽然在图2中示出了单个服务器设备220,但实际上,可以有数百、数千、数百万等的服务器设备220与多媒体分析平台230通信。
[0057] 多媒体分析平台230包括能够自动分析多媒体数据、策略数据和/或元数据的一个或多个设备,以确定与内容有关的策略是否阻止客户端设备210的用户访问多媒体内容。例如,多媒体分析平台230可以包括云服务器或云服务器组。在一些实现方式中,多媒体分析平台230可以被设计为是模块化的,从而特定软件部件可以根据特定需要被交换进或出。以这种方式,多媒体分析平台230可以容易地和/或快速地针对不同用途被重新配置。
[0058] 在一些实现方式中,如图2所示,可以在云计算环境232中主控多媒体分析平台230。注意,尽管本文描述的实现方式将多媒体分析平台230描述为在云计算环境232中被主控,但是在一些实现方式中,多媒体分析平台230可以没有基于云(即,可以在云计算环境以外被实施)或者可以部分地基于云。
[0059] 云计算环境232包括主控多媒体分析平台230的环境。云计算环境232可以提供计算、软件、数据访问、存储和/或其它服务,这些服务无需终端用户知道主控多媒体分析平台230的系统和/或设备的物理位置和配置。如所示,云计算环境232可以包括计算资源集234(被统称为“计算资源234”并且被个别地称为“计算资源234”)。
[0060] 计算资源234包括一个或者多个个人计算机、工作站计算机、服务器设备或者另一类型的计算和/或通信设备。在一些实现方式中,计算资源234可以主控多媒体分析平台230。云资源可以包括在计算资源234中执行的计算实例、在计算资源234中被提供的存储设备、由计算资源234提供的数据传送设备等。在一些实现方式中,计算资源234可以经由有线连接、无线连接或者有线连接和无线连接的组合来与其它计算资源234通信。
[0061] 如图2中进一步所示,计算资源234可以包括云资源组,比如一个或者多个应用(“APP”)234-1、一个或者多个虚拟机(“VM”)234-2、一个或多个虚拟化存储装置(“VS”)234-3、和/或一个或者多个管理程序(“HYP”)234-4。
[0062] 应用234-1包括可以被提供给环境200的一个或多个设备或由其访问的一个或者多个软件应用。应用234-1可以消除对在环境200的设备上安装和执行软件应用的需要。例如,应用234-1可以包括与多媒体分析平台230关联的软件和/或能够经由云计算环境232被提供的任何其它软件。在一些实现方式中,一个应用234-1可以经由虚拟机234-2向/从一个或者多个其它应用234-1发送/接收信息。
[0063] 虚拟机234-2包括执行程序的机器(例如,计算机)、如物理机器的软件实现方式。虚拟机234-2根据虚拟机234-2对任何实际机器的使用和与该实际机器的对应程度可以是系统虚拟机或者过程虚拟机。系统虚拟机可以提供支持执行完整操作系统(“OS”)的完整系统平台。过程虚拟机可以执行单个程序并且可以支持单个过程。在一些实现方式中,虚拟机
234-2可以代表用户(例如,客户端设备210的用户)来执行并且可以管理云计算环境232的基础结构,比如数据管理、同步或者长持续时间数据传送。
[0064] 虚拟化存储装置234-3包括在计算资源234的存储系统或者设备内使用虚拟化技术的一个或者多个存储系统和/或一个或者多个设备。在一些实现方式中,在存储系统的情境内,虚拟化的类型可以包括块虚拟化和文件虚拟化。块虚拟化可以是指从物理存储装置抽象化(或者分离)逻辑存储装置,从而使得可以访问存储系统而不考虑物理存储装置或者异构结构。该分离可以允许存储系统的管理员在管理员如何为终端用户管理存储装置时的灵活性。文件虚拟化可以消除在文件级访问的数据与文件被物理地存储的位置之间的依赖性。这可以实现存储装置使用的优化、服务器合并和/或非破坏文件迁移的执行。
[0065] 管理程序234-4提供允许多个操作系统(例如,“访客操作系统”)在主机计算机(比如计算资源234)上并行地执行的硬件虚拟化技术。管理程序234-4可以向访客操作系统呈现虚拟操作平台,并且可以管理对访客操作系统的执行。多种操作系统的多个实例可以共享虚拟化的硬件资源。
[0066] 网络240包括一个或者多个有线网络和/或无线网络。例如,网络240可以包括蜂窝网络(例如,长期演进(LTE)网络)、码分多址(CDMA)网络、3G网络、4G网络、5G网络或另一类型的蜂窝网络)、公用陆地移动网络(PLMN)、局域网(LAN)、广域网(WAN)、城域网(MAN)、电话网络(例如,公用交换电话网络(PSTN))、专有网络、临时网络、内部网、因特网、基于光纤的网络、云计算网络、和/或类似物、和/或这些或者其它类型的网络的组合。
[0067] 图2中所示的设备和网络的数目和布置被提供作为示例。在实践中,可以存在除了图2中所示的设备和/或网络之外的附加设备和/或网络、更少设备和/或网络、不同设备和/或网络或者被不同地布置的设备和/或网络。另外,可以在单个设备内实施图2中所示的两个或者更多设备,或者可以将图2中所示的单个设备实施为多个分布的设备。附加地或者备选地,环境200的设备集合(例如,一个或者多个设备)可以执行被描述为由环境200的另一设备集合执行的一个或者多个功能。
[0068] 图3是设备300的示例部件的示图。设备300可以对应于客户端设备210、服务器设备220、多媒体分析平台230和/或计算资源234。在一些实现方式中,客户端设备210、服务器设备220、多媒体分析平台230和/或计算资源234可以包括一个或者多个设备300和/或设备300的一个或者多个部件。如图3中所示,设备300可以包括总线310、处理器320、存储器330、存储部件340、输入部件350、输出部件360和通信接口370。
[0069] 总线310包括允许在设备300的部件之间通信的部件。处理器320被实施在硬件、固件或者硬件和软件的组合中。处理器320包括中央处理单元(CPU)、图形处理单元(GPU)和/或加速处理单元(APU))、微处理器、微控制器、数字信号处理器(DSP)、现场可编程门阵列(FPGA)、专用集成电路(ASIC)或其他类型的处理部件。。在一些实现方式中,处理器320包括能够被编程为执行功能的一个或者多个处理器。存储器330包括存储用于由处理器320使用的信息和/或指令的随机存取存储器(RAM)、只读存储器(ROM)和/或另一类型的动态或者静态存储设备(例如,闪存、磁存储器和/或光存储器)。
[0070] 存储部件340存储与设备300的操作和使用有关的信息和/或软件。例如,存储部件340可以包括硬盘(例如,磁盘、光盘、磁光盘和/或固态盘)、紧致盘(CD)、数字通用盘(DVD)、软盘、磁盒、磁带和/或另一类型的非瞬态计算机可读介质以及对应的驱动。
[0071] 输入部件350包括允许设备300比如经由用户输入来接收信息的部件(例如,触屏显示器、键盘、小键盘、鼠标、按钮、开关和/或麦克风)。附加地或者备选地,输入部件350可以包括用于感测信息的传感器(例如,全球定位系统(GPS)部件、加速度计、陀螺仪和/或致动器)。输出部件360包括从设备300提供输出信息的部件(例如,显示器、扬声器和/或一个或者多个发光二极管(LED))。
[0072] 通信接口370包括使设备300能够比如经由有线连接、无线连接或者有线连接和无线连接的组合来与其它设备通信的收发器式部件(例如,收发器和/或分离的接收器和发射器)。通信接口370可以允许设备300从另一设备接收信息和/或向另一设备提供信息。例如,通信接口370可以包括以太网接口、光接口、同轴接口、红外线接口、射频(RF)接口、通用串行总线(USB)接口、Wi-Fi接口、蜂窝网络接口等。
[0073] 设备300可以执行本文描述的一个或者多个过程。设备300可以基于处理器320执行由非瞬态计算机可读介质(比如存储器330和/或存储部件340)存储的软件指令来执行这些过程。计算机可读介质这里被定义为非瞬态存储器设备。存储器设备包括单个物理存储设备内的存储器空间或者跨多个物理存储设备散布的存储器空间。
[0074] 可以经由通信接口370来从另一计算机可读介质或者从另一设备向存储器330和/或存储部件340中读取软件指令。在被执行时。被存储在存储器330和/或存储部件340中的软件指令可以使得处理器320执行本文描述的一个或者多个过程。附加地或者备选地,可以取代软件指令或者与软件指令组合来使用硬接线的电路装置以执行本文描述的一个或者多个过程。因此,本文描述的实现方式不限于硬件电路装置和软件的任何具体组合。
[0075] 图3中所示部件的数目和布置被提供作为示例。在实践中,设备300可以包括除了图3中所示的部件之外的附加部件、更少部件、不同部件或者被不同地布置的部件。附加地或者备选地,设备300的部件集合(例如,一个或者多个部件)可以执行被描述为由设备300的另一部件集合执行的一个或者多个功能。
[0076] 图4是用于使用知识图嵌入分析多媒体内容的示例过程400的流程图。在一些实现方式中,图4的一个或多个过程框可以由多媒体分析平台230执行。在一些实现方式中,图4的一个或多个过程框可以由与多媒体分析平台230分离或包括多媒体分析平台230的另一设备或设备组执行,诸如客户端设备210和/或服务器设备220。
[0077] 如图4所示,过程400可以包括:接收与多媒体内容有关的多媒体数据,与多媒体内容和/或多媒体内容将被提供给的用户相关联的元数据,和/或与限制对特定多媒体内容的访问和/或限制由特定用户的访问的策略有关的策略数据(框410)。例如,多媒体分析平台230可以接收与多媒体内容有关的多媒体数据、与多媒体内容相关联的元数据、与要向其提供多媒体内容的用户相关联的元数据、与要向其提供多媒体内容的用户的特性相关联的元数据(例如年龄、位置、职称等)、与要提供多媒体内容的时间相关联的元数据、和/或与限制对特定多媒体内容的访问和/或限制由特定用户的访问的策略有关的策略数据。
[0078] 在一些实现方式中,当接收到多媒体数据、策略数据和/或元数据时,多媒体分析平台230可以接收数百万、数十亿、数万亿等的数据元素。以这种方式,多媒体分析平台230可以接收不能由人类行动者手动或客观处理的数据集。
[0079] 在一些实现方式中,多媒体内容可以包括视频内容、音频内容、动画内容、图像、文本内容和/或类似物。以这种方式,多媒体分析平台230可以同时、在不同时间等处理与多种类型的多媒体内容有关的数据。这允许多媒体分析平台230被用于各种分析场景,由此改善了多媒体分析平台230的使用。在一些实现方式中,并且作为具体示例,多媒体内容可以包括视频数据和音频数据。在一些实现方式中,当多媒体数据包括视频数据和音频数据时,多媒体分析平台230可以对齐视频数据和对应的音频数据,以便允许多媒体分析平台230标识音频的视觉上下文和/或视频的音频上下文。这可以允许多媒体分析平台230更准确地确定多媒体内容和/或对多媒体内容的访问是否违反策略,相对于不对齐的视频数据和对应的音频数据而言。
[0080] 在一些实现方式中,策略可以包括与访问多媒体内容有关的规则集。例如,策略可以限制对特定类型的多媒体内容的访问和/或限制由特定用户的访问(例如,基于用户的地理位置、与用户相关联的账户的服务级别、多媒体内容是否包括冒犯性内容,诸如裸露、暴力、特定语言等)和/或类似物。在一些实现方式中,策略数据可以包括文本数据(例如,文档、网页、文本文件等)。
[0081] 在一些实现方式中,元数据可以包括与试图访问多媒体内容的客户端设备210的用户相关联的信息。例如,元数据可以包括与试图访问多媒体内容的用户相关联的用户名、密码、IP地址、MAC地址、账户信息(例如,账户的服务级别、账户号等)和/或多媒体内容的目的地。附加地或备选地,作为另一示例,元数据可以与和组织相关联的用户相关联,并且可以标识用户的职称、组织内用户的级别、用户的角色、用户的许可级别(例如,与查看敏感或专有信息相关联的许可级别)和/或类似物,以允许多媒体分析平台230确定对内容的访问是否违反与组织的员工可以访问的内容有关的规则。
[0082] 在一些实现方式中,多媒体分析平台230可以在多媒体内容正在(例如,实时或接近实时地)被请求时接收多媒体数据。附加地或备选地,多媒体分析平台230可以在多媒体内容被请求之前接收多媒体数据。例如,多媒体分析平台230可以抢先处理多媒体内容,例如抢先确定多媒体内容是否违反策略。
[0083] 以这种方式,多媒体分析平台230可以接收多媒体数据、元数据和/或策略数据,以允许多媒体分析平台230处理多媒体数据、元数据和/或策略数据。
[0084] 如图4进一步所示,过程400可以包括使用第一技术集来处理策略数据以标识与该策略相关联的术语集和/或短语集(框420)。例如,多媒体分析平台230可以使用第一技术集来处理策略数据以标识与该策略相关联的术语集和/或短语集。
[0085] 在一些实现方式中,多媒体分析平台230可以处理与数百、数千、数百万等的策略相关联的数百万、数十亿、数万亿等的数据元素。以这种方式,多媒体分析平台230可以处理不能由人类行动者手动或客观处理的数据集。
[0086] 在一些实现方式中,当使用第一技术集处理策略数据时,多媒体分析平台230可以使用自然语言处理、文本分析、计算语言学和/或类似物来处理策略数据。例如,多媒体分析平台230可以使用自然语言处理来处理与策略相关联的文本,以标识在文本中包括的术语集和/或短语集。在一些实现方式中,如本文其他地方所述,多媒体分析平台230可以使用所标识的术语和/或短语来确定多媒体内容和/或对多媒体内容的尝试访问是否违反策略。
[0087] 在一些实现方式中,多媒体分析平台230可以标识与在策略数据中所标识的术语集和/或短语集语义上类似的术语集和/或短语集。例如,多媒体分析平台230可以使用词汇数据库(例如,WordNet)、多语言词汇化语义网络和本体(例如BabelNet)和/或类似物来标识与在策略数据中所标识的术语集和/或短语集语义上类似的术语集和/或短语集。
[0088] 以这种方式,标识与在策略数据中标识的术语集和/或短语集语义上类似的术语集和/或短语集可以允许多媒体分析平台230扩展策略为超出在策略数据中所标识的术语集和/或短语集。在一些实现方式中,经由使用与在策略数据中包括的术语集和/或短语集语义上类似的术语集和/或短语集,将策略扩展为超过在策略数据中所标识的术语集和/或短语集可以提高确定多媒体内容是否违反策略的准确性。此外,这允许对多媒体内容和/或试图访问多媒体内容是否违反策略进行更智能的分析。
[0089] 以这种方式,多媒体分析平台230可以使用第一技术集来处理策略数据,以允许多媒体分析平台230确定第一嵌入集。
[0090] 如图4进一步所示,过程400可以包括在标识术语集和/或短语集之后确定针对该术语集和/或短语集的第一嵌入集(框430)。例如,多媒体分析平台230可以在标识术语集和/或短语集之后确定针对该术语集和/或短语集的第一嵌入集。在一些实现方式中,第一嵌入集可以标识策略数据(例如,在策略数据中包括的术语,与在策略数据中包括的术语类似的术语等)。
[0091] 在一些实现方式中,多媒体分析平台230可以使用技术来确定第一嵌入集。例如,多媒体分析平台230可以使用Word2Vec、全局向量(GloVe)和/或类似物来确定第一嵌入集。在一些实现方式中,嵌入可以包括术语和/或短语到实数的n维向量的映射。在一些实现方式中,为了生成映射,多媒体分析平台230可以使用神经网络、对词语或术语共生矩阵的降维、概率模型和/或与出现词语或术语的上下文有关的明显表示。在一些实现方式中,嵌入可以基于语言项在语言数据(例如,文本)的样本中分布的方式来量化和/或分类语言项(例如,单词、术语、短语等)之间的语义相似性。在一些实现方式中,生成嵌入可以包括执行从具有每个词语或术语一个维度的空间到具有较低维度的连续向量空间的数学嵌入。
[0092] 在一些实现方式中,多媒体分析平台230可以确定与嵌入相关联的分数。例如,多媒体分析平台230可以确定针对嵌入的每个维度的分数。在一些实现方式中,分数可以基于所标识的术语和/或短语(例如,在策略数据中所标识的术语和/或短语)的上下文、在策略数据中包括的术语和/或短语的频率、执行机器学习和/或使用人工智能的结果(例如,确定被分析的策略数据类似于训练多媒体分析平台230的其他策略数据)、其他术语和/或短语与在策略数据中所标识的术语和/或短语语义上类似的度、和/或类似物。
[0093] 作为具体示例,如果多媒体分析平台230在策略数据中标识术语“战争”,则多媒体分析平台230可以确定针对由术语“暴力”、“加油”、“裸露”等所标识的其他维度的分数,该分数指示这些维度与“战争”相关联的程度。在一些实现方式中,阈值分数或相对于较低分数的较高分数可以指示维度与所标识的术语和/或短语更紧密关联。例如,如果多媒体分析平台230针对“暴力”维度确定0.7的分数并且针对“裸露”维度确定0.1的分数,则多媒体分析平台230确定相对于“裸露”,暴力维度与“战争”更紧密关联。
[0094] 继续前面的示例,多媒体分析平台230可以确定相对于“裸露”相关内容,包括“暴力”相关内容的多媒体内容更可能违反对“战争”相关内容的限制。以这种方式,多媒体分析平台230可以确定针对与嵌入相关联的各种维度的分数,该分数指示维度与嵌入相关联的可能性。这为多媒体分析平台230提供了灵活性,以智能分析多媒体内容,由此改善对多媒体内容的分析。
[0095] 以这种方式,多媒体分析平台230可以在标识术语集和/或短语集之后,并且在处理多媒体数据和/或元数据以确定第二嵌入集之前,确定针对该术语集和/或短语集的第一嵌入集。
[0096] 如图4进一步所示,过程400可以包括使用第二技术集处理多媒体数据和/或元数据,以确定标识多媒体数据和/或元数据的第二嵌入集(框440)。例如,多媒体分析平台230可以使用第二技术集处理多媒体数据和/或元数据,以确定标识多媒体数据和/或元数据的第二嵌入集。在一些实现方式中,第二技术集的技术可以与一种类型的数据相关联。例如,第一技术可以与音频数据相关联,第二技术可以与视频数据相关联,第三技术可以与元数据相关联,等等。
[0097] 在一些实现方式中,多媒体分析平台230可以使用第二技术集来处理多媒体数据和/或元数据,以标识图像中的对象、视频内容中特定类型的运动、音频内容中特定类型的声音等。在一些实现方式中,当处理多媒体数据和/或元数据时,多媒体分析平台230可以处理数百万、数十亿,数万亿等的数据元素。以这种方式,多媒体分析平台230可以处理不能由人类行动者手动或客观处理的数据集。附加地或备选地,多媒体分析平台230可以处理与数百、数千、数百万等的多媒体内容项的相关联的元数据和/或多媒体数据、对多媒体内容的请求,等等。
[0098] 在一些实现方式中,当处理音频数据时,多媒体分析平台230可以从音频数据中提取音频序列。例如,多媒体分析平台230可以从音频数据中提取等长的音频序列。在一些实现方式中,多媒体分析平台230可以使用递归神经网络来处理音频序列。例如,多媒体分析平台230可以处理音频序列以标识音频中的特定声音,例如尖叫声、加油声、男性声音、女性声音和/或类似物。在一些实现方式中,多媒体分析平台230可以确定针对在音频中所标识的声音的嵌入。例如,多媒体分析平台230可以以与本文其他地方描述的类似方式来确定嵌入。附加地或备选地,多媒体分析平台230可以以与本文其他地方所描述的类似方式来确定针对维度集的分数,该维度集与针对音频数据的嵌入相关联。
[0099] 在一些实现方式中,当处理视频数据时,多媒体分析平台230可从视频数据提取视频序列。例如,多媒体分析平台230可以从视频数据中提取等长的视频序列。附加地或备选地,并且作为另一示例,多媒体分析平台230可以从视频序列(例如,从视频数据提取的视频序列)中提取帧。
[0100] 在一些实现方式中,多媒体分析平台230可以使用卷积神经网络来处理帧。例如,多媒体分析平台230可以使用卷积神经网络来处理帧,以标识帧的特征,诸如帧中所示的对象。附加地或备选地,多媒体分析平台230可以使用运动提取模型(例如,增量视觉追踪器,以从帧中提取运动特征来确定帧中所示的运动或动作的类型)来处理帧。
[0101] 附加地或备选地,多媒体分析平台230可以使用递归神经网络来处理帧(例如,以提取帧的时间特征,诸如视频数据中所示的事件序列,在视频数据中示出特定对象或动作的时间量等)。在一些实现方式中,多媒体分析平台230可以以与本文其他地方所描述的类似方式确定针对视频数据中所标识的对象、运动、动作等的嵌入。附加地或备选地,多媒体分析平台230可以以与本文其他地方所描述的类似方式来确定针对维度集的分数,该维度集与针对视频数据的嵌入相关联。
[0102] 在一些实现方式中,当处理元数据时,多媒体分析平台230可以使用自然语言处理、文本分析、计算语言学和/或类似物来处理元数据。例如,多媒体分析平台230可以处理元数据,以标识在元数据中包括的术语和/或短语(例如,以确定与元数据相关联的客户端设备210的用户的年龄,以确定与元数据相关联的客户端设备210的用户的位置,以确定与客户端设备210和/或客户端设备210的用户相关联的组织,以基于多媒体内容的描述来确定多媒体内容的上下文等)。在一些实现方式中,多媒体分析平台230可以以与本文其他地方描述的类似方式来确定针对在元数据中所标识的术语和/或短语的嵌入。附加地或备选地,多媒体分析平台230可以以与本文其他地方所描述的类似方式来确定针对维度集的分数,该维度集与针对元数据的嵌入相关联。
[0103] 以这种方式,多媒体分析平台230可以在使用知识图处理第一嵌入集和/或第二嵌入集之前,使用第二技术集来处理多媒体数据和/或元数据,以确定第二嵌入集。
[0104] 如图4进一步所示,过程400可以包括使用知识图处理第一嵌入集和/或第二嵌入集,以确定多媒体内容和/或用户的访问是否违反策略(框450)。例如,多媒体分析平台230可以使用知识图处理第一嵌入集和/或第二嵌入集,以确定多媒体内容和/或用户的访问是否违反策略。在一些实现方式中,多媒体分析平台230可以使用知识图来基于用户的年龄、用户的位置、在多媒体内容中包括的图像、在多媒体内容中包括的对象、多媒体内容中示出的动作、在多媒体内容中包括的声音和/或类似物来确定用户是否被允许访问多媒体内容(例如,基于使用知识图来确定多媒体内容和/或对多媒体内容的访问是否满足策略中包括的许可和/或约束)。
[0105] 在一些实现方式中,当处理第一嵌入集和/或第二嵌入集时,多媒体分析平台230可以处理数千、数百万、数十亿等的数据元素。另外,多媒体分析平台230可以处理与数千、数百万等的多媒体内容项有关的数据和/或对多媒体内容的请求。此外,多媒体分析平台230可以关于数百、数千、数百万等的策略来处理多媒体内容和/或对多媒体内容的请求。以这种方式,多媒体分析平台230可以处理不能由人类行动者手动或客观处理的数据集。
[0106] 在一些实现方式中,在使用知识图处理第一嵌入集和/或第二嵌入集之前,多媒体分析平台230可以标识与嵌入相关联的术语集。例如,嵌入可以包括针对与嵌入相关联的维度集的概率集。在这种情况下,维度集的概率集的子集可以与术语和/或短语相关联(例如,针对篮球的嵌入可以与术语“球”以及针对与术语“球”有关的维度集的概率集相关联)。继续前面的示例,多媒体分析平台230可以基于与术语相关联的概率集来确定针对与嵌入相关联的每个术语和/或短语的分数(例如,平均分数、加权平均分数、加权分数等)。
[0107] 在一些实现方式中,分数可以基于所标识的术语和/或短语(例如,在文本中标识的术语和/或短语,在视频中标识的对象和/或动作等)的上下文。附加地或备选地,分数可以基于与多媒体内容相关联的术语和/或短语的频率(例如,术语和/或短语被包括在文本中的频率,由在视频中包括的术语和/或短语所标识对象的频率等)。附加地或备选地,分数可以基于执行机器学习和/或使用人工智能的结果(例如,确定被分析的数据与训练多媒体分析平台230的其他数据类似)。以这种方式,多媒体分析平台230可以确定一个分数,该分数指示与嵌入相关联的术语集和/或短语集标识针对其生成嵌入的数据的可能性。
[0108] 在一些实现方式中,多媒体分析平台230可以标识与具有满足阈值的分数的第一嵌入集和/或第二嵌入集相关联的术语集和/或短语集。以这种方式,多媒体分析平台230可以标识具有标识多媒体内容、元数据和/或策略的最高概率的术语集和/或短语集(例如,相对于与第一嵌入集和/或第二嵌入集相关联的其它术语)。例如,对于策略,多媒体分析平台230在标识策略时可以标识包括“暴力”、“裸露”和“年龄”的术语集和/或短语集。
[0109] 附加地或备选地,作为多媒体内容的示例,多媒体分析平台230在标识多媒体内容时可以标识包括“加油”、“欢呼”和“球”的术语集和/或短语集。附加地或备选地,并且作为元数据的示例,多媒体分析平台230可以在标识试图访问内容的用户位置时标识包括“沙特阿拉伯”和“中东”的术语集和/或短语集,并且在标识试图访问内容的用户年龄时标识“十九”。这允许多媒体分析平台230通过使用利用阈值可能性标识多媒体内容、用户和/或策略的术语集和/或短语集来快速和有效地确定多媒体内容和/或对多媒体内容的访问是否违反策略。
[0110] 在一些实现方式中,当使用知识图处理第一嵌入集和/或第二嵌入集时,多媒体分析平台230可以利用标识与第一嵌入集和/或第二嵌入集相关联的术语集和/或短语集的信息来填充知识图。例如,多媒体分析平台230可以使用知识图将该术语集和/或短语集结构化为层级关系集,其中该术语集和/或短语集中包括的每个术语和/或短语是知识图中的节点(例如,母节点和子节点的关系,诸如“运动”和“篮球”节点,其中“篮球”节点是“运动”节点的子节点)。这允许多媒体分析平台230通过允许多媒体分析平台230区分粒度概念(诸如不同类型的运动)、不同的上下文(诸如学术上下文或娱乐上下文)等来以智能的方式、快速且有效地分析多媒体内容和/或对多媒体内容的访问。
[0111] 在一些实现方式中,多媒体分析平台230可以确定多媒体内容和/或用户的访问是否违反策略。例如,多媒体分析平台230可以基于使用知识图的结果来确定多媒体内容和/或用户的访问是否违反策略。在一些实现方式中,多媒体分析平台230可以使用知识图的边来确定多媒体内容和/或用户的访问是否违反策略。例如,知识图的边可以指示在多媒体内容、用户访问和/或策略之间的匹配。例如,知识图的边可以指示访问多媒体内容的用户定位在沙特阿拉伯,多媒体内容包括裸露,并且策略阻止位于沙特阿拉伯的用户访问包括裸露的多媒体内容。继续前面的示例,多媒体分析平台230可以确定多媒体内容和/或用户的访问违反策略。
[0112] 在一些实现方式中,多媒体分析平台230可以基于使用知识图处理第一嵌入集和/或第二嵌入集的结果来确定分数。例如,多媒体分析平台230可以使用分数作为关于多媒体内容是否在知识图中被正确标识的置信度量。继续前面的示例,分数可以基于先前由多媒体分析平台230确定的其他分数,可以基于或可以指示用于填充知识图的信息与知识图的节点的匹配度,可以基于或可以指示与多媒体内容相关联的节点和与策略相关联的节点的匹配度,可以基于或可以指示被分析的多媒体内容与已知多媒体内容的匹配度,等等。在一些实现方式中,多媒体分析平台230可以在执行动作时使用分数(例如,可以基于满足阈值的分数来生成特定建议)。以这种方式,多媒体分析平台230可以使用分数来确定所标识的多媒体内容是否被正确标识。
[0113] 以这种方式,多媒体分析平台230可以使用知识图处理第一嵌入集和/或第二嵌入集,以确定多媒体内容和/或用户的访问是否违反了策略,以允许和/或使多媒体分析平台230基于处理第一嵌入集和/或第二嵌入集的结果来执行动作。
[0114] 如图4进一步所示,过程400可以包括基于处理第一嵌入集和/或第二嵌入集的结果来执行动作(框460)。例如,多媒体分析平台230可以基于处理第一嵌入集和/或第二嵌入集的结果来执行动作。
[0115] 在一些实现方式中,多媒体分析平台230可以阻止对多媒体内容的访问。附加地或备选地,多媒体分析平台230可以向客户端设备210提供指示用户被拒绝访问多媒体内容的消息和/或通知。在一些实现方式中,多媒体分析平台230可以记录与试图访问有关的信息(例如,与试图访问有关的日期、时间、用户名等)。附加地或备选地,多媒体分析平台230可以允许访问多媒体内容。附加地或备选地,当多媒体分析平台230允许访问多媒体内容时,多媒体分析平台230可以以与上述类似的方式提供消息和/或记录与尝试访问有关的信息。
[0116] 在一些实现方式中,多媒体分析平台230可以生成建议。例如,多媒体分析平台230可以生成与对多媒体内容的访问是否应该被提供有关的建议。继续前面的示例,多媒体分析平台230可以确定对内容的访问不违反策略,并且尝试访问内容的用户应该被允许访问该内容。在一些实现方式中,多媒体分析平台230可以向管理员提供建议(例如,提供经由与管理员相关联的客户端设备210来显示的建议),以便允许管理员决定是否允许用户访问内容。
[0117] 在一些实现方式中,多媒体分析平台230可以模糊多媒体内容违反策略的部分,诸如通过移除该部分,模糊一部分视频内容或图像,从音频内容移除声音,以其它声音(例如,哔哔声)替换音频内容中的声音等。附加地或备选地,多媒体分析平台230可以提供多媒体内容的过滤版本(例如,现有的过滤版本),诸如R级电影的电视版本、露骨歌曲的无线电编辑版本等。在一些实现方式中,多媒体分析平台230可以代表请求多媒体内容的用户来请求允许访问来自另一客户端设备210的另一用户的内容。
[0118] 在一些实现方式中,多媒体分析平台230可以存储标识分析结果的信息。例如,多媒体分析平台230可以存储标识多媒体内容是否违反策略、是否允许用户访问多媒体内容等的信息。在一些实现方式中,多媒体分析平台230可以使用存储的信息来快速且有效地确定多媒体内容和/或对内容的访问是否违反策略,以改善未来的分析等。通过减少或消除对多媒体分析平台230多次处理相同多媒体内容、多次分析同一用户对多媒体内容的访问等的需求,这保存了多媒体分析平台230的处理资源。
[0119] 在一些实现方式中,多媒体分析平台230可以提供分析结果以经由客户端设备210进行显示。例如,多媒体分析平台230可以提供用于显示的结果,以允许客户端设备210的用户执行对该分析的质量审查,输入信息以修改分析结果等。在一些实现方式中,多媒体分析平台230可以使用从客户端设备210接收的信息来修改对多媒体内容的访问,执行机器学习以改善未来的分析,等等。
[0120] 在一些实现方式中,多媒体分析平台230可以安排会议。例如,多媒体分析平台230可以安排与多媒体内容、对多媒体内容的尝试访问等有关的会议(例如,在组织的管理者之间、立法者之间、等)。在一些实现方式中,当安排会议时,多媒体分析平台230可以使用与潜在会议参与者相关联的电子日历来标识会议的可用时间,并且可以生成针对会议的日历项(例如,会议邀请、会议请求、预约等等)。
[0121] 以这种方式,多媒体分析平台230可以基于处理第一嵌入集和/或第二嵌入集的结果来执行动作。
[0122] 虽然图4示出了过程400的示例框,但是在一些实现方式中,过程400可以包括除了图4中描绘的框之外的附加框、更少框、不同框或者被不同地布置的框。附加地或者备选地,可以并行执行过程400的框中的两个或者更多框。
[0123] 本文描述的一些实现方式提供了多媒体分析平台,其能够自动地分析多媒体内容,并且确定策略是否允许特定用户访问该多媒体内容(例如,基于用户的年龄、用户的位置、多媒体内容的类型、与用户相关联的组织等)。以这种方式,多媒体分析平台可以自动并动态地实施与内容有关的策略。这改善了策略对多媒体内容的应用,和/或提高了将策略应用于多媒体内容的效率。另外,这节省了由于内容审查效率低下而消耗的处理资源。此外,这允许审查不能由人类行动者手动或客观处理的内容量,或不能由人类行动者在阈值时间量内处理的内容量。
[0124] 前述公开内容提供了示例和描述,但是没有旨在于穷举或者使实现方式限于公开的精确形式。修改和变化按照以上公开内容是可能的或者可以从实现方式的实践中被获悉。
[0125] 如本文所使用的,术语“部件”旨在于被广义地解释为硬件、软件和/或硬件和软件的组合。
[0126] 本文中结合阈值描述了一些实现方式。如本文所使用的,满足阈值可以是指大于阈值、多于阈值、高于阈值、大于或等于阈值、小于阈值、少于阈值、低于阈值、小于或等于阈值、等于阈值等。
[0127] 将清楚,可以在不同形式的硬件、固件或者硬件和软件的组合中实施本文描述的系统和/或方法。用来实施这些系统和/或方法的实际专门化的控制硬件或者软件代码没有限制实现方式。因此,本文描述系统和/或方法的操作和行为而没有参照具体软件代码,应理解,可以设计软件和硬件以基于这里的描述来实施系统和/或方法。
[0128] 尽管在权利要求中记载和/或在说明书中公开了特定特征组合,这些组合也没有旨在于限制可能实现方式的公开内容。事实上,可以用没有具体地在权利要求中记载和/或在说明书中公开的方式组合这些特征中的许多特征。虽然以下列举的每个从属权利要求可以直接地依赖于仅一个权利要求,但是可能的实现方式的公开内容与权利要求集合中的每个其它权利要求组合地包括每个从属权利要求。
[0129] 除非明确地这样描述,否则不应将这里使用的单元、动作或者指令解释为关键或者必需的。也如这里使用的那样,冠词“一个(一种)”旨在于包括一个或者多个项目并且可以与“一个或者多个”可互换地使用。另外,如这里使用的那样,术语“集合”旨在于包括一个或者多个项目(例如,有关项目、无关项目、有关和无关项目的组合等)并且可以与“一个或者多个”可互换地使用。在旨在于仅一个项目时,使用术语“一个”或者相似言语。也如这里使用的那样,术语“具有”等旨在于是开放式术语。另外,除非明确地另有陈述,则短语“基于”旨在于意味着“至少部分基于”。