首页 / 使用附加终端进行呼叫

使用附加终端进行呼叫有效专利 发明

技术内容

使用附加终端进行呼叫 [0001] 相关申请 本申请根据35 USC 119要求2011年12月30日提交的美国申请No. 61/581,995的优先权,该文献的公开内容全部被合并。 背景技术 [0002] 存在这样的通信系统,其允许使用诸如互联网协议(IP)之类的基于分组的协议通过诸如因特网之类的基于分组的网络在两个或更多最终用户终端之间进行现场语音和/或视频呼叫。这种类型的通信有时称为“IP语音”(VoIP)或者“IP视频”。 [0003] 为了使用通信系统,每个最终用户首先将客户端应用程序安装到他或她的用户终端的存储器上,使得客户端应用程序被设置用于在该终端的处理器上执行。为了建立呼叫,一个用户(呼叫者)向客户端应用程序指明至少一个其他用户(被呼叫者)的用户名。当执行时,客户端应用程序于是可以控制其相应终端以访问将用户名映射到IP地址的数据库,并且因此使用指明的用户名查找被呼叫者的IP地址。数据库可以使用服务器或者对等(P2P)分布式数据库或者二者的组合来实现。一旦呼叫者的客户端取回了被呼叫者的IP地址,那么它就可以使用该IP地址请求经由因特网或者其他这样的基于分组的网络在呼叫者与被呼叫者终端之间建立现场语音和/或视频流,从而建立起呼叫。典型地,还需要认证过程,其可能涉及用户经由客户端提供凭据以便由服务器集中地认证,和/或可能涉及所述两个或更多用户的客户端应用程序之间依照P2P型认证方案交换认证证书。 [0004] 随着能够执行通信软件的电子设备在家庭周围以及在移动的便携式设备中越来越流行,于是可能的是多个不同的终端可以在呼叫一端处可用,每个终端具有音频和/或视频输入并且所述终端中的每一个可以潜在地安装有客户端应用程序的实例。在这样的情况下,可能希望的是考虑如何最佳地利用这些多个资源以便最大化通信系统的有用性。 [0005] 此外,存在提供用于呼叫的远程接口的一些现有的装置。例如,蓝牙头戴式受话器提供了远离处置呼叫的电话的输入/输出接口。DECT电话(数字增强无绳电话)提供了远离基站的手持送受话器。也存在一种运行在智能电话上并且在计算机上表现为视频设备列表中的视频设备的视频应用程序(从而它可以通过简单地在视频设备列表中选择它而例如用在VoIP客户端中)。 发明内容 [0006] 依照本发明的一个或多个实施例,提供了一种用于当在本地链路(例如wi-fi)上多个具有音频和/或视频转换器的近端终端潜在地可用于在呼叫中使用时处置通过基于分组的网络(例如因特网)的语音和/或视频呼叫的设备、计算机程序和方法。例如,近端终端可以包括一个或多个膝上型计算机、平板计算机、移动电话、位于家庭周围的电视机和/或机顶盒。实施例可以利用多个可用终端的可用性以用于进行基于分组的呼叫的目的。 [0007] 依照一个或多个实施例,提供了一种包括第一终端和多个第二终端的装置。第一终端耦合到广域的基于分组的通信网络并且安装有混合器客户端应用程序,该混合器客户端应用程序用于使用在基于分组的网络上实现的基于分组的通信系统来执行语音或视频呼叫。所述多个第二终端经由本地无线链路耦合到第一终端,并且其中每一个安装有轻量子客户端的相应实例,所述子客户端用于经由混合器客户端参与呼叫,但是与混合器客户端相比具有减少的功能。 [0008] 混合器客户端可以被配置成基于用户凭据使用基于分组的通信系统通过基于分组的网络与远程第三终端建立呼叫,该用户凭据从第三终端的角度将混合器客户端标识为基于分组的通信系统内的呼叫的端点。第二终端中的每一个可以可操作来同时产生相应的音频和/或视频流,每个与不同的相应近端用户关联,并且每个相应的子客户端可以被配置成通过本地无线链路将相应流传送至混合器客户端,以便用在由通过所述用户凭据标识的混合器客户端建立的呼叫中。 [0009] 混合器客户端可以被配置成在其中呼叫使用接收自子客户端的流的多终端操作状态与其中呼叫使用由第一终端产生的流而没有来自子客户端的流的同一终端操作状态之间切换。在多终端操作状态中,混合器客户端被配置成在第一终端处混合同时的接收自子客户端的流,编码第一终端处的混合的流,并且通过由所述用户凭据标识的基于分组的通信系统将该混合的流作为所述呼叫的一部分而传送至第三终端。 [0010] 依照一个或多个其他的实施例,提供了一种包括第一终端和一个或多个第二终端的装置。第一终端耦合到广域的基于分组的通信网络并且安装有第一客户端应用程序,该第一客户端应用程序用于使用在基于分组的网络上实现的基于分组的通信系统执行语音或视频呼叫。所述一个或多个第二终端经由本地无线链路耦合到第一终端,并且其中每一个安装有轻量子客户端的相应实例,所述子客户端用于经由第一客户端参与呼叫,但是与第一客户端相比具有减少的功能。 [0011] 第一客户端可以被配置成基于用户凭据使用基于分组的通信系统通过基于分组的网络与远程第三终端建立呼叫,该用户凭据从第三终端的角度将第一客户端标识为基于分组的通信系统内的呼叫的端点。所述一个或多个第二终端中的每一个可以可操作来产生相应的音频和/或视频流,每个与相应近端用户关联,并且所述一个或多个相应的子客户端中的每一个可以被配置成通过本地无线链路将相应流传送至第一客户端,以便用在由通过所述用户凭据标识的第一客户端建立的呼叫中。 [0012] 第一客户端可以被配置成在其中呼叫使用接收自所述一个或多个子客户端的一个或多个流的第二操作状态与其中呼叫使用由第一终端产生的流而没有来自子客户端的流的第一操作状态之间切换。在第二操作状态中,第一客户端被配置成在第一终端处将接收自所述一个或多个子客户端的所述一个或多个流编码成编码的流,并且通过由所述用户凭据标识的基于分组的通信系统将该编码的流作为所述呼叫的一部分而传送至第三终端。 [0013] 依照一个或多个另外的实施例,提供了一种依照以上所述的混合器或者第一客户端应用程序。 [0014] 依照一个或多个另外的实施例,提供了一种依照以上所述的子客户端应用程序。 [0015] 关于上述任何实施例,以下任何可选的特征可以适用或者可能不适用。 [0016] 所述减少的功能可以包括以下一个或多个: (a)子客户端是只有输入的客户端,其被配置成仅仅接收输入音频和/或视频流以便经由第一终端上的混合器或者第一客户端传送至第三终端,并且不播放出所述呼叫的输出音频和/或视频流,而在所述两种操作状态下,混合器或者第一客户端被配置成在第一终端处播放出接收自第三终端的所述呼叫的输出音频和/或视频流; (b)子客户端被配置成仅仅在本地链路上通信并且不使用通过所述基于分组的通信网络实现的基于分组的通信系统; (c)子客户端未配置有用于使用所述基于分组的通信系统建立呼叫的呼叫设立协议,而混合器或者第一客户端配置有用于建立所述呼叫的呼叫设立协议; (d)子客户端被配置成不采取基于分组的通信系统的用户凭据,并且因此近端用户不使用基于分组的通信系统的凭据登录到子客户端; (e)子客户端不编码音频和/或视频流以便在通过本地链路发送该流到混合器或者第一客户端时压缩该流,而混合器或者第一客户端则确实编码混合的流以便在通过基于分组的通信系统将该流传送至第三终端时压缩该流; (f)相对于混合器或者第一客户端用来压缩通过基于分组的通信系统去往第三终端的混合的流的压缩,子客户端仅仅使用通过本地链路发送至混合器或者第一客户端的音频和/或视频流的减少的压缩;以及 (g)子客户端不加密通过本地链路发送至第一客户端的音频和/或视频流,而混合器或者第一客户端确实加密通过基于分组的通信系统传送至第三终端的混合的流。 [0017] 混合器或者第一客户端可以被配置成检测本地链路上的子客户端的一个或多个实例的存在,并且根据所述检测在所述状态之间切换。 [0018] 混合器或者第一客户端可以被配置成检测本地链路上的从所述子客户端中的一个或多个到来的流,并且根据所述检测在所述状态之间切换。 [0019] 根据检测的切换可以包括在第一终端处向近端用户呈现用户选项以便选择用在所述多终端操作状态或者第二操作状态中的所述一个或多个子客户端。 [0020] 所述切换可以根据所述检测包括自动地在所述操作状态之间切换。 [0021] 混合器或者第一客户端可以被配置成在没有子客户端的实例存在的情况下和/或在没有来自子客户端的流的情况下使用同一终端操作状态或者第一操作状态作为缺省状态。 [0022] 混合器或者第一客户端可以被配置成混合来自所述近端用户之中的多个同时活跃的说话者的流。 [0023] 混合器或者第一客户端可以被配置成通过确定接收自子客户端的哪个流最佳地代表来自所述近端用户之中的活跃的说话者并且仅仅选择该活跃的说话者的流以便作为所述呼叫的一部分传送至第三终端来混合所述流。 [0024] 混合器或者第一客户端可以是主客户端,其被配置成使用在混合器客户端处实现的呼叫设立协议建立所述呼叫。 [0025] 可以将另外的客户端安装到服务器上,并且混合器或者第一客户端可以被配置成充当在第一终端处混合和/或编码所述流并且经由在所述另外的客户端处实现的呼叫设立协议建立呼叫的中继器。 [0026] 第一终端可以是具有嵌入式处理器的监视器、电视机和用于插入到监视器电视机中的机顶盒之一。 [0027] 所述一个或多个第二终端中的至少一个可以是膝上型计算机、平板计算机和移动电话之一。 [0028] 本地无线链路可以是本地无线网络。基于分组的通信网络可以是互联网。所述通信系统可以是VoIP系统。 [0029] 依照一个或多个另外的实施例,提供了一种包括由上述任何元件执行的操作的方法。 附图说明 [0030] 图1为通信系统的示意性表示, 图2为用户终端的示意性框图, 图3为在一个用户终端上运行的软件的示意性框图, 图4为在另一个用户终端上运行的软件的示意性框图,以及 图5为通信系统的一端的示意性框图。 具体实施方式 [0031] 本发明的实施例使用已经存在的设备作为运行在不同设备上的VoIP客户端的实例的远程输入设备。该远程输入设备(其在本文中可能被称为RIDE)可以例如是运行RIDE客户端应用程序的智能电话、膝上型计算机或者平板计算机;并且可能在会议室场景中对于电视机或者机顶盒上的VoIP是有用的,或者简单地作为远程无线麦克风对于运行在台式计算机上的主要VoIP客户端是有用的。本文描述的实施例可以结合任何适当的硬件、软件、固件或者其组合来实现。在至少一些情况下,实施例可以以存储在计算机可读存储介质上的计算机可读指令的形式实现。当在本文中使用时,“计算机可读存储介质”预期指的是所有法定形式的存储介质。因此,“计算机可读存储介质”并不预期覆盖本身是诸如载波或信号之类的非法定主题。 [0032] RIDE利用已经存在的硬件作为运行在另一个设备上的VoIP客户端的输入设备。 特别地,可能的是使用智能电话、平板计算机或者膝上型计算机作为会议场景中的麦克风和/或摄影机,或者作为用于运行在用于插入到电视机中的机顶盒或电视上的VoIP的输入设备。 [0033] 所述系统可以同时使用若干远程设备以输入音频和视频二者。再者,远程设备不可以作为桌面上的“正常”设备而暴露,而是完全集成到VoIP客户端中,并且让VoIP客户端自动检测到它们等等,以及将它们与不同于台式计算机的终端(例如电视)一起使用。 [0034] 本发明的实施例可以有利地通过使用许多设备而提供改进的音频质量,每个所述设备靠近说话者(例如其可能在会议室场景中是有用的)。 [0035] 本发明的实施例也可以在VoIP在电视上(VoIP-on-TV)的场景中是有用的,潜在地消除购买外部摄影机和/或麦克风的需要。此外,据信这种情况下的音频质量将被改进,因为所述麦克风将大大靠近谈话者。 [0036] 在视频会议场景中,与对于整个房间发送仅仅一个流形成对照的是,本发明的实施例可以方便发送来自房间中的参与者(在他们的设备上运行RIDE客户端应用程序)中的每一个的一个视频流。在实施例中,也可能的是充分利用设备上可用的硬件视频编码。 [0037] 存在为什么上面的装置潜在地可以是有益的许多原因: · 许多当今的设备(例如现代智能电话)具有相当良好质量的输入音频能力。使用置于会议桌上的设备在许多情况下将显著地改进音频质量,和/或构成获得多麦克风机构的买得起且实际可行的方式。 [0038] · 对于电视而言,将意味着所述麦克风可以被放置成大大靠近说话者,并且从而潜在地显著提高音频质量,并且潜在地无需导线。与视频相组合,也可能意味着用户将不必为其电视购买任何附加的设备以使用VoIP系统。 [0039] · 在视频情况下,可能的是使用设备上可用的硬件加速视频编码。 [0040] 具有良好A/V(音频和/或视频)输入能力的设备可以用作运行在不同设备上的主要VoIP客户端实例的远程输入设备(RIDE)。远程输入设备可以或者在VoIP客户端中实现,或者它可以被实现为运行在智能电话、平板计算机或者膝上型计算机上的独立应用程序。RIDE可以方便音频和/或视频的低延迟记录,并且将流发送至RIDE混合器。所述连接可以通过例如WLAN或者是蓝牙数据连接。 [0041] RIDE混合器将流组合成有意义的东西,其然后被输入到VoIP客户端中。参见例如图5,以后将更详细地返回到其元件。 [0042] 在音频情况下,混合可以意味着检测活跃的说话者,并且仅仅将该流输入到VoIP客户端中。它也可能是时间对齐并且真正混合信号的更复杂情况。双声道情况的第三选项是通过使用来自左声道上的一个RIDE的输入以及来自右声道上的另一个RIDE的输入创建立体声流。然后,这两个RIDE将有效地实现一种立体声麦克风。 [0043] 在视频情况下,“混合”可以再次包括仅仅传递与当前活跃的说话者对应的流。可替换地,它可以转发所有流。 [0044] 在一些情况下,RIDE混合器被集成到主要VoIP客户端中,并且分别钩连到音频和视频库中。 [0045] 也可以提供某种形式的运行的网络发现服务,从而系统可以自动地检测何时(配对的)RIDE可供使用。然后,UI可以提示用户关于他/她是否想要使用所述RIDE。 [0046] 可以对该(这些)RIDE与RIDE混合器之间的连接加密。 [0047] 架构:RIDE可以包括两个主要的部件:RIDE客户端和RIDE混合器。可以存在多个连接到每个混合器的RIDE客户端。这些客户端在本地wi-fi网络上(或者可能地通过蓝牙数据连接)将例如与短音频帧(或者视频)对应的UDP有效载荷发送至混合器。 [0048] 可以将RIDE客户端集成到“正常”VoIP客户端中,使得它可以用作远程输入设备。 然而,这对于用户可能变得迷惑不清。另一种思想是将RIDE作为单独的应用程序运送。于是,客户端将是能够连接到远程RIDE混合器的轻量独立应用程序。 [0049] 在一些实施例中,RIDE混合器为集成到在其他方面正常的“主要”VoIP客户端中的模块。它需要联网能力并且钩连到音频和视频库中。对于外部库而言,当枚举音频和视频设备时,RIDE可能表现为附加的“设备”。为了方便设备的容易连接,RIDE混合器模块也可以运行某种形式的网络发现服务,例如UPNP或者Bonjour。 [0050] 当使用多个输入设备时,RIDE混合器负责对齐输入信号并且将它们组合成增强的信号。在只有音频的情况下,这可以是诸如选择与当前活跃的说话者对应的输入设备之类的事情。可替换地,它可以包括混合两个或更多同时活跃的流。 [0051] 对于视频情况而言,混合器可以做许多事情:它可以仅仅拾取一个流(例如与活跃的说话者对应),或者它可以只是传递所有流(在VoIP客户端支持发送多个视频流的情况下)。 [0052] 图1为在基于分组的网络101上实现的通信系统的示意图,所述基于分组的网络例如是诸如因特网之类的广域互联网络。该通信系统包括多个用户终端102,包括第一用户终端102a、多个第二用户终端102b-102d和第三用户终端102z。用户终端102中的每一个可以采取台式计算机、膝上型计算机、平板计算机、移动电话(其也可以称为“智能电话”)、具有嵌入式处理器和电视接收器的电视机、没有电视接收器但具有嵌入式处理器的监视器以及用于通过有线连接插入到电视机或监视器中的机顶盒中的任何一个的形式。在一个或多个实施例中,第一终端102a包括例如会议室或起居室中的大的电视机或监视器,并且第二终端102b-d中的每一个包括膝上型计算机、平板计算机或智能电话之一。 [0053] 第二终端102b、102c和102d中的每一个与不同的相应用户关联,所述用户例如是多方语音或视频呼叫中的不同参与者。 [0054] 第一用户终端102a和第三用户终端102z(以及未示出的多个其他用户终端)中的每一个包括VoIP客户端的相应实例。依照一个或多个实施例,至少第一终端102a上的VoIP客户端310包括RIDE混合器。此外,第二终端中的每一个安装有在这里可以称为RIDE客户端的简装(stripped-down)轻量客户端应用程序310’的相应实例。第一终端102a上的包括RIDE混合器的VoIP客户端310可以被认为是主要客户端,并且第二终端102b-d上的RIDE客户端310’可以被认为是子客户端。它们的关系将很快进一步加以讨论。也参见图3、图4和图5。 [0055] 系统可以进一步包括无线链路103,借助于该无线链路,第一终端102a和第二终端102b-d可以被允许例如直接地或者经由办公室或家庭中的无线路由器105彼此通信。无线链路103因此可以采取本地无线网络(LAN)的形式。在这个意义上,本地可以表示在相同广播小区或者相同子网中,至多通过一个住户或办公室路由器105链接。形成对照的是,互联网或者移动蜂窝网络是广域网的例子,其经由多个路由跳或者多级蜂窝网络元件而在城镇、城市或者国家之间以及在蜂窝情况下超出单个小区的规模上通信。 [0056] 在无线路由器105包括调制解调器的情况下,无线链路103也可以使得终端102a和102b-d能够访问因特网101。 [0057] 在图1中同样被示为连接到互联网101的是例如由VoIP提供商提供的基于分组的通信系统的数据仓104i。这可以采取服务器、分布式对等数据库或者二者的组合的形式。 对等数据库分布在多个不同用户的多个最终用户终端之间,这些用户典型地包括事实上不是呼叫的参与者的一个或多个用户。然而,这不是唯一的选项,并且中心服务器可以用作一种替换方案或者附加地使用。不管哪种方式,这样连接数据仓104i以便对于运行在包括第一和第三用户终端102a、102z的多个终端中的每一个上的客户端应用程序中的每一个可经由互联网101访问。数据仓104被设置成提供用户名到IP地址(或者其他这样的网络地址)的映射以便允许不同用户的客户端应用程序出于建立语音或视频呼叫的目的通过因特网101(或者其他基于分组的网络)彼此建立通信信道,或者确实是其他类型的通信,例如即时消息传送(IM)或者语音邮件。此外,一个或多个其他服务器104ii可以连接到因特网 101,例如互联网服务提供商(ISP)的服务器。 [0058] 图2示出了依照本发明实施例的示例性最终用户终端102的示意性框图,该终端可以与上面提到的终端中的任何一个对应,包括第一终端102a、第二终端102b-d和第三终端102z。用户终端102包括一个或多个计算机可读存储介质以及单个或多个核心处理器形式的处理设备204,所述存储介质例如诸如内部或外部硬盘驱动器或者闪存之类的存储器202。存储器202安装有有关通信客户端应用程序310或310’的实例,耦合到处理设备 204,并且被设置成使得通信客户端可以在处理设备204上执行。终端102也包括多个外围设备206、208、210、212、214、216、218、220,其每一个耦合到处理器并且其每一个可以在与处理器相同的芯片或者不同的芯片上并且在终端外壳的内部或外部实现。 [0059] 在这些之中,终端102可以包括本地无线收发器206,该本地无线收发器用于通过本地无线链路103例如向或从另一个用户终端102和/或经由无线家庭或办公室路由器 105发送和接收信号和数据,并且在其中路由器105包括内部调制解调器的情况下,那么这也使得终端102能够通过因特网101通信。终端102可以包括用于通过无线蜂窝移动网络发送和接收信号和数据的无线蜂窝收发器218,其在用户具有适当的合约的情况下也可以提供用于往来终端102的内部访问的可替换路径。此外,终端102可以包括有线调制解调器216和/或外部连接器220,例如用于连接到外部调制解调器的USB(通用串行总线)端口,其再次地可以提供往来终端102的内部访问的可替换手段。 [0060] 用户终端102进一步包括多个AV(音频和/或视频)转换器,例如麦克风208、扬声器210、摄影机212(其也可以称为“网络照相机”)和屏幕214。术语AV转换器在这里可以用来指称音频或视频输入或输出的任何装置。终端表示为用户装备的分立单元,而转换器为给定终端的部件或者外围设备。在诸如手持式送受话器和插接站之类的一些情形下,分类可能不是立即就清楚明白的,但是出于本申请的目的,如果终端具有处理器204并且执行其自己的通信客户端(不论是主要VoIP客户端310还是轻量子客户端310’)的实例,那么其可以被认为是明显不同的。 [0061] 参照图3,安装在存储器202上并且被设置成在第一用户终端102a的处理器204上执行的软件包括操作系统302,并且在操作系统302上运行多个应用程序304、306、308、 310中的一个或多个,例如包括web浏览器应用程序304、电子邮件客户端应用程序306以及在电视或机顶盒的情况下的电视应用程序308。这些应用程序也包括主要VoIP客户端 310的实例。主要VoIP客户端310包括输入/输出(I/O)层312,该输入/输出层包括信令协议320和语音和/或视频引擎318。语音和/或视频引擎318包括RIDE混合器形式的混合器319。主要VoIP客户端310也包括:客户端引擎314,该客户端引擎包括用于通过因特网101例如与第三终端102z建立VoIP呼叫的呼叫设立协议;以及完整的用户接口层 316。运行在第三用户终端102z上的VoIP客户端可以与第一终端的类似,并且可以包括或者可以不包括混合器元件319。 [0062] 参照图4,安装在存储器202上并且被设置成在第二用户终端102b-d中的每一个的处理器204上执行的软件包括操作系统302’,并且在操作系统302’上运行多个应用程序 304’、306’、322、324中的一个或多个,例如包括web浏览器应用程序304、电子邮件客户端应用程序306以及在移动电话的情况下的蜂窝呼叫应用程序322(例如电路交换呼叫)和文本消息传递应用程序324。这些应用程序也包括在这里也称为RIDE客户端的轻量子客户端310’的实例。该子客户端310包括输入/输出(I/O)层312,该输入/输出层包括基本本地信令协议320’和简化的用户接口层316’。在一些实施例中,轻量子客户端310’不包括语音或视频引擎,或者至少不包括实现主要客户端310的语音和/或视频引擎318的完整编码和解码(压缩和解压缩)的语音或视频引擎。在一些实施例中,轻量子客户端310’也不包括混合器319。此外,轻量子客户端310’可以不包括客户端引擎,该客户端引擎具有用于通过因特网101建立VoIP呼叫的呼叫设立协议,即因此轻量子客户端310’不能自己与诸如第三终端102z之类的终端建立呼叫。 [0063] 以上仅仅是例子,并且应当理解,通常第一、第二和第三用户终端中的任何一个可以包括所描述的转换器208、210、212、214和/或收发器206、216、218、220的任意组合;并且可以安装有且运行所描述的应用程序304、304’、306、306’、308、322、324的任意组合。 [0064] 在图解说明的图1-5的装置中,第一终端102a上的主要VoIP客户端310被设置成使用VoIP通信系统经由收发器208、210、212、214之一并且经由本地无线收发器206和本地无线链路103,包括经由无线家庭或办公室路由器105通过因特网101与第三终端102z上的VoIP客户端设立呼叫。无线链路例如可以是wi-fi或蓝牙或者任何其他适当的短距自组织(ad-hoc)无线协议。第一和第三终端102a、102z上的VoIP客户端因此能够在它们之间建立语音或视频呼叫,并且因此作为呼叫的一部分在它们之间交换语音和/或视频流。有关的呼叫设立以及通常的呼叫信令协议在每个VoIP客户端的客户端引擎314中实现。该呼叫设立可以包括以上面关于图1讨论的方式基于提交远程用户的用户名在数据仓 104中查找远程用户终端(例如第三终端102z)的IP地址。 [0065] 此外,第一终端102a上的主要VoIP客户端310被设置成能够使用客户端310和 310’的I/O层中的信令协议320、320’分别与第二终端120b-102d中的一个或多个上的子客户端310中的一个或多个中的每一个建立本地连接。例如,第一终端102a上的主要VoIP客户端310可以被设置成通过诸如UPNP或Bonjour之类的发现协议发现在无线链路103上存在子客户端310’。可替换地,第一终端102a上的主要VoIP客户端310可以不必本身知道存在子客户端,而是可以改为被设置成例如仅仅基于用于音频和/或视频流的基本握手和/或报头协议检测来自子客户端310中的一个或多个的到来的音频和/或视频流的存在。 [0066] 在一个用例中,第一终端102a为大的电视机或监视器或者机顶盒,其位于会议室或者住宅的诸如起居室之类的共享空间中,并且可选地配备有麦克风208和/或摄影机 212;并且第二终端102b-102d中的每一个为诸如膝上型计算机、平板计算机或智能电话之类的便携式终端,其配备有麦克风208和摄影机212中的至少一个。 [0067] 第二终端102b-d中的每一个与不同的相应用户关联,并且能够产生代表其不同相应用户的语音和/或图像的单独的相应音频和/或视频流。子客户端310’与主要VoIP客户端310之间通过本地链路103的连接有利地允许使得来自第二终端102b-d上的子客户端310’的音频和/或视频流可用作呼叫的可替换输入,代替其上的主要VoIP客户端310实际地与第三终端建立呼叫的第一终端102a上的麦克风208或照相机212。来自不同子客户端的多个流在第一终端102a上的主要VoIP客户端310的混合器319处混合,并且由第一终端102a上的主要VoIP客户端310的语音和/或视频引擎318编码且作为由第一终端 102a上的客户端310建立的呼叫的一部分从那里通过因特网101传送至第三终端102z上的客户端。在这里,建立可以表示由第一终端102a上的客户端310发起的传出的呼叫或者由其接受的到来的呼叫,但是无论哪种方式,它都由第一终端102a上的客户端310建立,因为它使用在第一终端102a上的客户端310中实现的呼叫设立协议协商呼叫,并且一般就第三终端102z上的客户端和外部VoIP通信系统而言,在这个意义上它是呼叫的端点,即它是呼叫设立协议的端点。 [0068] 在语音混合的情况下,混合器319可以被配置成例如基于比较信号能量水平和/或通过应用语音识别算法检测来自第二终端102b-d上的子客户端310的多个到来的语音流中的哪一些在任意给定时间是活跃的或者至少最佳地代表活跃的说话者或者最活跃的说话者。然后,混合器319将仅仅选择最活跃的说话者的流以便被编码并且作为呼叫的一部分传送至第三终端102z,其中选择最活跃的在整个谈话中是变化的,从而在整个呼叫中选择性地隔行扫描不同的流。可替换地或者此外,混合器319可以掺合并且时间对齐代表第二终端102b-d的两个或更多同时说话的用户的两个或更多同时活跃的语音流。 [0069] 在视频混合的情况下,混合器319可以再次被配置成例如基于图像和/或运动识别算法检测来自第二终端102b-d上的子客户端310的多个到来的语音流中的哪一些在任意给定时间是活跃的或者至少最佳地代表活跃的参与者或者最活跃的参与者。然后,混合器319将仅仅选择最活跃的参与者的视频流以便被编码并且作为呼叫的一部分传送至第三终端102z。可替换地或者此外,混合器319可以被配置成组合不同第二终端102b-d上的子客户端中的两个或更多的来自不同用户的视频流,例如并行地发送和/或组合成分屏表示。 [0070] 由于第一终端102a配备有麦克风208和照相机212中的至少一个,例如安装在会议室电视屏幕或监视器上或附近的网络照相机,于是它也能够产生用于使用VoIP系统通过互联网101与第三终端102z进行呼叫的音频和/或视频流。因此,主要客户端310可操作于两个操作状态:为了与第三终端102z进行呼叫而使用来自第二终端102b-d中的一个或多个上的所述一个或多个子客户端310’的一个或多个输入流的一个状态,以及不这样而是改为依赖于第一终端102a本身处产生的音频和/或视频输入流的状态。如上面所提到的,第一终端102a上的主要VoIP客户端310也可以被配置成检测子客户端310’中的一个或多个在本地链路103上的存在,或者检测本地链路103上来自子客户端310’中的一个或多个的到来的语音或视频流。响应于检测到任一个或者这两个,主要VoIP客户端310可以被配置成自动地将相应检测的子客户端310’添加到呼叫,或者向用户呈现在将它们添加到呼叫之前人工地选择的选项,条件是该选项被选择。第一终端102a上的主要客户端310可以被配置成用于呼叫的主客户端,因为它控制选择在任何给定时间使用哪种操作状态。在其中需要用户输入以便选择所述选项的情况下,这可以由用户直接在第一终端102a处或者在第二终端102a之一处输入,其然后向第一终端上的主要客户端310发送请求选择该选项的请求信号。在后一场景中,主要客户端310仍然可以被认为仍然是呼叫的主控方,因为请求由第一终端102a上的主要客户端310仲裁和作用。 [0071] 依照上面的特征,允许实现所述多个近端(第二)终端102b-d(即在相同本地链路 103上的与第一终端相同的一端处)的多个近端用户与至少一个远端(第三)终端102z的至少一个远端用户之间的多方语音或视频会议。 [0072] 这种装置的一个优点在于,它对于代表第二终端102b-102d的不同用户的流中的每一个实现了最佳质量的音频和/或视频,因为每个用户使用他们自己相应的个人附近的麦克风和/或照相机,而不是用于更嘈杂的房间且更远离房间中的大多数或者所有用户的一般照相机或麦克风。例如,在会议室中,每个用户可以通过他们自己的个人电话120b、c或d上的他们自己的麦克风说话,作为与第三终端102z的另一个远程用户的呼叫的一部分,但是仍然都在联合会议室电视屏幕或监视器102a上观看远程用户。类似的场景可能出现在住宅的诸如具有电视机的起居室之类的共享空间中。 [0073] 此外,用户使用诸如移动电话、平板计算机和膝上型计算机之类的现有个人设备——即用户出于其他目的已经持有的设备,意味着用户有利地不必仅仅为了参与多个近端用户通过主要设备102a和本地链路103连接在呼叫的一端的多方呼叫而购买新的装备。 例如,如果第一终端102a是安装有完整VoIP客户端的唯一设备,那么不必购买额外的网络照相机或麦克风以便与通过第一终端102a呼叫的多个用户进行呼叫。 [0074] 在特定用例中,在任何给定时间只有单个第二终端102b、102c或102d上的单个子客户端的单个用户可能碰巧连接到第一终端102a上的主要客户端310。在这种情况下,混合器319才会编码和传送来自一个子客户端310’的一个流。然而,用户仍然可以得出一种优势,因为他们能够使用他们个人的(第二)终端102b、102c或102d作为更靠近或者更方便的用于呼叫的输入源,而不必为第一终端102a购买附加的外部麦克风或照相机。 [0075] 应当指出的是,设备102a和102b-d不是同等的,因为第一终端102a安装有并且运行具有完整VoIP功能加上添加的RIDE混合器319的主要VoIP客户端310,而第二终端 102b-d中的每一个仅仅安装有客户端310’的简装轻量版本。这有利地意味着第二终端 102a可以充当用于呼叫的输入设备,但是它们本身不必招致与存储或执行主要VoIP客户端310的完整实例关联的完整存储或处理资源。客户端的“轻量”性质的一些示例性表现如下,其中的任一个或者全部可以以任意组合实现。 [0076] 在一个实施例中,轻量子客户端310’为只有输入客户端。换言之,其未配置有从主要VoIP客户端310接收作为来自第三终端102z的呼叫的一部分的到来的音频和/或视频流的能力,并且未配置有在其相应第二终端102b、102c或102d处播放出这样的流的能力。 在这种情况下,子客户端310’和第二终端102b、102c或102d仅仅意在提供用于呼叫的可替换输入源而不是输出手段。相反地,来自第三终端102z的呼叫的到来的音频和/或视频将经由第一终端102a、例如经由会议室屏幕被播放出。 [0077] 在实施例中,轻量子客户端310’未配置有VoIP呼叫设立协议以便使用主要客户端310有权访问的VoIP系统通过互联网101直接参与与诸如第三终端102z之类的远程终端的VoIP呼叫。因此,子客户端310’本身不能建立VoIP呼叫。相反地,子客户端310’仅仅被配置成通过诸如wi-fi或者蓝牙之类的本地链路103建立与第一终端上的主要客户端 310的本地连接,并且从那里,VoIP呼叫由从VoIP通信系统的外部角度来看、包括从第三终端102z的角度来看充当呼叫的端点的第一终端上的主要客户端310建立。例如,轻量子客户端310’不能在数据仓104i中查找IP地址,而主要客户端310可以(借助于客户端引擎 314)。在实施例中,轻量子客户端310’可能未配置有直接访问互联网101的任何能力,并且可能只能够经由本地收发器206通信以便建立与第一终端102a上的主要客户端310的本地连接。 [0078] 注意,以上所述并不一定意味着第二终端102b-d上的其他应用程序(但不是轻量通信客户端310’)不能通过其他手段,包括经由互联网或者另一个网络通信,例如以便执行蜂窝呼叫或者消息传递、实现web访问或者发送和接收电子邮件。但是,轻量通信客户端 310’以及在实施例中没有第二终端102b、102c或102d上的其他应用程序能够使用所讨论的VoIP系统直接设立VoIP呼叫,也不从到来的VoIP呼叫接收到来的音频或视频流。在实施例中,除了使用本地收发器206建立与第一终端102a上的主要客户端310的本地连接之外,轻量子客户端可能不能够访问因特网或者任何其他外部通信装置。 [0079] 此外,轻量子客户端310可能未配置有音频和/或视频编解码器或者配置有最小的编解码器,以便不应用或者应用很少的编码或解码(即用于压缩和解压缩的目的)。在子客户端310’执行少量编码的情况下,这意味着相对于主要VoIP客户端310’的语音和/或视频引擎318实现的编码,以较少的压缩为代价招致每单位时间相对较少的处理循环。这可能意味着主要客户端310的AV引擎318必须将来自子客户端310’的一个或多个流转码。在其中子客户端不应用编码的情况下,音频和/或视频可以以未压缩的形式通过本地链路103发送,并且主要客户端310上的AV引擎319不必转码。在一些实施例中,子客户端310’可以利用第二设备102b、102c或102d上存在的硬件编码和解码,但是在子客户端 310’本身的实际软件中可以不应用任何编码(或者仅仅最少量的预处理)。 [0080] 此外,轻量子客户端310’可能未配置有用于其通过本地链路103发送至主要客户端310的流的加密。然而,在其他实施例中,可能仍然优选的是加密。 [0081] 此外,轻量子客户端310’可以配置有相对于主要客户端310缩减或简化的用户接口。 [0082] 在其最基本的要点中,轻量子客户端310’只需是用于通过本地无线链路将媒体样本流送至第一终端102a的简装应用程序。 [0083] 主要客户端310与子客户端310’之间的另外的区别可能在于通常在VoIP系统内的VoIP系统用户名或者用户凭据以及需要什么来登录到每种类型的客户端的问题。如上面所讨论的,VoIP系统的每个用户具有存储在数据仓104i中的关联的用户名,在该数据仓中,该用户名被映射到与该终端对应的用户名的IP地址。当用户想要在第一终端102a处登录时,他们将他们的用户名(和口令)输入到第一终端102a上的主要VoIP客户端310中,并且经由数据仓104i(其可以是服务器或P2P数据库或者二者的组合)使得第一终端 102a的地址可用。因此,如果第三终端102z上的VoIP客户端需要找到第一终端102a的地址,那么它使用与第一终端102a关联的用户名在数据仓104i中查找该地址。因此,利用用户名登录进主要客户端310,并且第一终端102a和主要客户端310因而在所讨论的VoIP系统内具有身份,并且从VoIP系统的外部角度来看、包括从第三终端102z(以及第三终端 102z上的VoIP客户端)的角度来看将表现为与诸如第三终端102z之类的远程终端的呼叫的端点。然而,在实施例中,轻量子客户端310’可以被配置成不使用用户名或者外部VoIP系统的其他凭据,并且不需要使用这样的凭据的登录过程。因此,子客户端310’和第二终端102b、102c、102d在VoIP系统内没有单独的身份,并且不能在数据仓104i中单独地被查找。相反地,即使在与多个近端用户的多方会议呼叫的情况下,第一终端102a和主要客户端310仍然在外部(即在本地链路或网络103之外)表现为呼叫的单个端点,并且多个第二终端102b、102c、102d及其客户端310’在本地链路或网络103上的存在对于第三终端102z(以及对于第三终端102z上的客户端)是不透明的。 [0084] 相反地,轻量子客户端310’可以通过本地链路103仅仅实现与第一终端102a上的主要客户端310的简单配对操作。技术人员将熟悉“配对”设备的概念。通常,两个设备只需配对一次以便彼此通信。配对过程典型地在设备第一次接收到来自它尚未与之配对的设备的连接请求时自动地被触发。一旦建立起配对,那么它可以被设备记住,这些设备于是可以在没有用户干预的情况下连接到每一个。当希望时,配对关系可以在以后由用户移除。 在配对过程期间,涉及的两个设备通过创建可以称为链路密钥的共享秘密而建立关系。如果链路密钥由这两个设备存储,那么就说它们是“键合的”。想要仅仅与键合的设备通信的设备可以用密码方法认证另一个设备的身份,并且因而确保它是之前被配对的相同设备。 一旦产生了链路密钥,那么可以加密设备之间的认证的ACL链路,使得它们通过空气波交换的数据受保护免受窃听。链路密钥可以在任何时间由任一设备删除。 [0085] 在一些实施例中,第二终端102b、102c或102d到第一用户终端102a的配对要求第二或第一终端(取决于在哪里发起配对)在其显示屏幕上示出必须由用户输入到配对的另一个设备中的个人身份码或者秘密信息。然而,这并不相当于使用用户名或者VoIP系统的其他这样的用户凭据登录,因为个人身份码或秘密信息在VoIP系统内没有含义,事实上超出所述两个配对的设备之外也没有任何含义。在其他实施例中,无需用户信息以允许配对,并且在仍然还有另外的实施例中,可以提示用户简单地接受该配对而不输入秘密信息。 [0086] 在一种变型中,一些或者所有主要客户端310可以在诸如服务器之类的另外的终端上实现,所述服务器例如家庭或办公室网络的本地服务器,或者互联网上的服务器 104ii,例如ISP的服务器。在例如这种情况下,诸如电视机、监视器或者机顶盒102a之类的第一终端可以安装有虚拟客户端,该虚拟客户端充当第二终端102b-d上的子客户端310’与所述另外的终端104ii上的VoIP客户端之间的中继器。VoIP呼叫设立可以由所述另外的终端104ii上的VoIP客户端处置,并且所述混合可以由第一终端102a上的虚拟客户端或者所述另外的终端104ii上的VoIP客户端处置。 [0087] 应当理解的是,上面的实施例仅仅通过例子的方式加以描述。给定本文的公开内容,其他的变型对于本领域技术人员可以变得清楚明白。