首页 / 数据可视化

数据可视化无效专利 发明

技术内容

技术领域 本发明涉及数据可视化。 背景技术 生成和分析数据可视化和信息可视化是困难的任务。例如,数据可视 化包括线图、条形图、直方图、饼形图、测量图、分散绘图、星形图、压 力场可视化等等。每一个这些数据表示法或可视化均具有优点和缺点。当 数据量增加时,在这些数据可视化中很难识别图形。 发明内容 一方面,本发明的特征在于提供一数据可视化的方法,该方法包括接 收用于控制第一种数据可视化类型的一个或多个特征的第一组一个或多 个参数的第一组一个或多个值,接收用于控制第二种数据可视化类型的一 个或多个特征的第二组一个或多个参数的第二组一个或多个值,第二种数 据可视化类型是与第一种数据可视化类型不同的一种数据可视化类型,且 生成一组数据可视化,该可视化具有基于第一组参数的一个或多个值和第 二组参数的一个或多个值的特征。 另一方面,本发明的特征在于一种数据可视化方法,包括将维数设置 为一种N维正多边形,映像到每一个N维数据值的一个轴上,并显示映像 的数据值。本发明的实施例可能具有以下一个或多个优点。对称为一种维 数锚(dimensional anchor)(DA)的一种图像原语的描述能帮助生成 新的可视化并提供对分析信息可视化的理解。DA表示用于构成包括平行 坐标(Parallel Coordinates)、散绘图(Scatterplot Matrices)、 径向可视化(Radviz)、测绘图(Survey Plots)、圆弧(Circle Segment) 等等的多种可视化的一种统一的结构或模型。通过将值指定给与编码上述 基本可视化的各种几何图形元素有关的参数来构建一DA。多种DAs能用 来创建所有上述可视化和许多新的可视化以及内插式可视化。本发明的一 个或多个实施例的详细内容将在附图和下面的说明书中讲述。本发明的其 它特征、目的以及优点从说明书及其附图以及权利要求中将会很清楚。 附图的说明 图1是说明一维数锚的图。 图2是说明使用斜角坐标的第一分散绘图的图。 图3是说明第二分散绘图的图。 图4是说明第三分散绘图的图。 图5是说明第四分散绘图的图。 图6是说明第五分散绘图的图。 图7是说明第一展开多边形的图。 图8是说明第二展开多边形的图。 图9是说明正多边形的图。 图10是说明具有弹簧(spring)的平行坐标的图。 图11是说明在平行坐标和圆形平行坐标间的内插可视化的图。 图12是说明重迭的径向可视化的图。 图13是一种典型的数据可视化系统的框图。 在各个附图中相同的参考符号表示相同的零件。 详细说明 弹性常数用来表示点间的相关值。例如,径向可视化(Radviz)包括 取n维数据点作为在圆周平均分隔的点。弹簧的一端连在每一个圆周点 上。每一个弹簧的另一端连在一数据点上。弹簧常数Ki等于固定点的第 i个坐标的值。然后显示每一个数据点,其中弹簧力总和等于0。所有数 据点值通常归一化在0和1之间。例如,如果所有n坐标具有相同值,则 该数据点准确地位于圆的中央。如果该点是一单位矢量点,它准确地位于 圆边缘上的固定用于维数的弹簧的固定点。许多点可能映像到相同的位 置。这表示数据的一种非线性转换,该数据存在一定的对称性和生成直观 显示画面。该可视化的一些特征包括:位于大约相等的坐标值的点接近中 央;在圆上维数彼此相反的有相似值的点靠近圆中央;具有一个或多个坐 标值大于其它坐标值的点更靠近那些维数;点的位置与圆周特定维数的布 图相关;由于弹性相似,该数据的布图能被理解;在n维中一线映像到一 线;以及其它2维几何物体映像到在平面中的2维物体上。 一可视化被模拟成由V:A→D定义的函数V,该函数映像一数据组到 一Display D。该V是矩阵(M×N)数据和另外的参数P1,P2,……,Pn的 行和列的函数,该函数编码有关特定可视化的信息。作为其它可视化的函 数实现可视化。 Vnew=f(V1,V2,V3,……,Vn),每一个Vi表示一可视化。 可视化被限定到由P1,P2,……,Pn定义的参数空间。通过改变参数, 可定义可视化的类。我们将描述的一组参数,它包括上述的和在下面要详 细描述的所有可视化的参数。 可视化还是特定可视化的内在几何结构的函数。可视化几何结构的数 据和部件被编码成所谓的原始维数锚(DA)。 维数锚(DA)是有助于生成新的可视化和理解一种分析信息可视化的 原始图形。DA表示用于包括平行座标、散绘图、径向可视化、测绘、圆 弧以及其它的各种可视化的一种统一的结构或模型。通过将值赋予编码上 述可视化的基本要素的各种几何图形单元有关的参数来创建维数锚。多个 DAs可被用来创建所有上述可视化和许多新的可视化以及内插式可视化。 被选择与该维数锚相关联的一列数据。许多参数与DA相关。下面所描述 的9个参数,作为该模型的一个实施例。因此用于我们的模型的可视化可 能被定义成函数V=F(DA参数,DAs的几何形状)。如果所有的DAs共 享相同的参数值,那幺V=F(P1,P2,……,Pn,DA几何形状)。如果DAs 的几何形状由直线、以及由连续的点定义的简单曲线构成,可视化的定义 或详细说明可能简单产生,但足以生成现在所使用的许多标准的多维多变 量的可视化。另外,也能产生许多新颖的可视化。 在实施例中,该模型具有9个参数: P1-分散绘图点的大小 P2-从创建分散绘图点的定位点延伸的垂直线的长度 P3-与在分散给图中相同数据点有关的相连点的线的长度 P4-在测绘图中长方形的长度 P5-平行坐标线的长度 P6-用于平行坐标线的块因子 P7-径向可视化/弹簧绘图点的大小 P8-从创建径向可视化/弹簧绘图点的定位点延伸的“弹簧”线的长 度 P9-用于“弹簧”K常数的图像放大因子。 在一基础水平上,维数锚是在二维分散绘图中的一个简单轴。它通常 与来自数据集或数据库的一维数或变量有关。用通常将最小和最大值与该 轴的未端附近的点对应的标准方式,将相关维数的数据值映像到该轴上。 标签或刻度线标记也与维数锚有关。通常,沿轴的那些标准间距被称为坐 标值。我们称为定位点的映像数据点是与维数的数据点对应的坐标值,即, 与沿一维数锚点的坐标值对应。 参照图1,示出了具有许多从定位点延伸的线的一维数锚的一个典型 显示画。可能着色垂直线以显示用于每加仑油行驶英里数的数据(如汽车 数据集)分布。另外,线的颜色可能表示汽车的类型(如,美国—红色或 黑色,日本—绿色或浅色以及欧洲—紫色)。 与DA有关的九个参数控制DA如何与其它DAs相互作用以形成图形结 构,如点、线以及改进的可视化。例如,为产生一个分散绘图,DA的一 个参数被用来控制分散绘图点(P1)的大小。由来自两个DAs的定位点 线交叉形成该点。现在描述这九个参数及如何形成可视化。 与分散绘图的结构有关的三个DA参数已经定义过。分散绘图的一个 可能结构是一垂直线在DA上的定位点向外扩展。与另一个DA(相同数据 集的另一列)上相同数据点有关的定位点也具有向外(在该DA的两端) 扩展的垂直线。如果这两条垂直线交叉,交叉点为分散绘图点。第一参数 (P1)控制分散绘图点的大小,点的大小范围从0(点未画出)到1(显 示的一大点)。通常在分散绘图中,点的大小、形状或颜色能与数据集中 其它维数(变量或列)相关。在一实施例中,所选择的列决定颜色,且形 状是一圆形。在另一实施例中,一组参数控制该形状以便能使用图标、或 彩色图标的表示可视化的分类。然而,无论分散绘图点是否被显示,这些 分散绘图点均是维数锚的一基本参数(P1)。从定位点扩展的垂直线的 交叉点对任何排列或任意数量的维数锚起作用。 维数锚能定义成多个线段的任何序列。这允许任意形状的曲线如弧形 作为维数锚。根据该定义,仍能容易地构造用于分散绘图的垂直延长线。 这些附加排列能生成其它可视化并将在以下讨论。参照图2,分散绘图的 另一个定义能使用斜角坐标等等,而不必是来自坐标轴的垂直线。 两个另外的参数(P2,P3)控制来自定位点和连接所有与一个数据点 有关的分散绘图的线的垂直线的显示。P2控制从DA到分散绘图点延伸的 垂直线的长度。例如,参照图3,P2约为2,而参考图4,P2参数为1.0。 这些参数定义从0(没有线)到1(显示所有交叉线)。当使用N维数锚 时(在一个数据集中用N变量或维数),通常达到为可视化中每一数据点 生成的N点以使这些N点相连。P3控制在一等边三角形图案中的三维锚。 参照图5,显示了生成分散绘图显示点的交叉垂直线(参数P2=1.0)。 在图6中,连接与相同数据点有关的显示点(P3=1.0)。如所看到的, 在该可视化中所生成的三角形是非常相似的。通常,P2和P3将生成N边 多边形,如果DAs被构造成正多边形的话。 另一个参数(P4)以及一个特别指定的数据集维数(DDD)(变量或 列)用作DA以构造测量图或与圆弧相似的可视化。P4参数控制从定位点 延伸的矩形的大小。该大小也与在该定位点上的维数值相关。一个DDD 选项没有分类,它使用数据下载的顺序。P4最大可能值的最终限制需要 生成测量值。控制该最大可能值以使P4矩形不触及来自其它DA的P4矩 形。通过使用P4参数,由于其限制和适当的维数锚的排列,容易构造测 量图和修改的圆弧。(该圆弧变为直线并伸出到正多边形而不是一个圆, 但可视化的本质仍然相同)。 在其它实施例中,获得与圆弧相似的可视化的结构。例如,在实施例 中,如下产生CCCViz(颜色相关列可视化)。其它数据集有特定分类维 数。根据分类维数来对这些列分类(即指定的数据集维数)。使用用于该 数据集的维数的灰度映象以及使用彩虹彩绘该分类维数。改变P4参数, 即改变在测量图中的矩形长度,生成彩色相关列可视化。可视化说明维数 (灰度)是否与特定分类维数(色标)有关。当维数数量很小,即低于 30时,CCCViz很有用。 DAs的各种排列能生成数据的部分排序。例如,在交叉的网格图案中 排列的可视化仅使用弹簧参数P7和P9,且该显示生成简单的对角图案, 因为每一“弹簧”具有对称的穿过该对角的相反弹簧。该交叉DA图案执 行数据的可视分类,该数据能被用于判别数据的分类。 平行坐标可视化的结构如下。简单地连接从一DA定位点到另一DA 定位点的线。这些连接线的长度由DA参数(P5)控制。然而,如果耗尽 连接在所有DAs上的所有定位点(每一个定位点连接到N-1个其它定位 点),就能获得另外的有趣的可视化。我们定义另外一个参数(P6), 它表示P5连接线能交叉多少DAs。当该块参数设置为0时产生常见的平 行坐标可视化。使用P5和P6参数,当将DAs从圆中央排列成径向辐时, 在圆中也能产生平行坐标。 如果沿维数锚的定位点被认为是固定点,在该固定点处假想的弹簧连 接到可动数据点上,那么能产生与径向可视化相似的可视化。参数P7被 用来控制位于显示中的点的大小,在这些显示位置处弹簧力的总和为0。 当维数锚被排列为N维正多边形时产生称作多边形可视化(Polyviz)的 增强的径向可视化显示。径向可视化的一个局限是在圆中央许多数据点能 重迭,尽管它们具有不同的坐标值。当固定弹簧点沿DA在正多边形中展 开时,点重迭的机会大大小于在原始径向可视中的点重叠机会。如果DAs 被压缩成沿圆周均匀分布的点,就能产生最初的径向可视化显示。多边形 可视化是最好利用圆或正多边形的总面积的可视化。另一个参数(P8) 被用来画从固定弹簧点延长到弹簧力的总和为0的显示点的线。另一个参 数(P9)也被用作显示中的图像放大因子。 参考图7,用七个点表示多边形视化。图7和图8画出“展开的”多 边形例,而图9画出正多边形。图7和图8具有显示成从定位点延长的线 的弹簧线(P8=1)。 在实施例中,参考图10,重新将DAs排列成平行坐标排列中并设置 合适的P值,产生使用弹力的好的辩别式。注意在图10中在平行坐标排 列中,定位点和延长到该点的线看起来与平行坐标排列非常相似,除第一 点(1,1,1,1)外。因为该归一化(在一列中的所有值被归一化到0 和1之间),在第一点上的弹簧力总和为0,且显示该点,无论该画面的 几何中心是如何定义的。通常,它将是显示画面的中心,但根据DAs的排 列,它能被定义在一些其它点上。如果有人想检测所有维数具有最小值的 界外点,几何中心应被定义成与相等弹簧力中央不同。图像放大参数P9 设计成为0的所有点位于几何中心,在.5处它对应标准的物理弹簧(弹 力=P9×2×K×DX),且在较高值时它放大弹簧K值。慢慢增加P9,表示所 有点正离开几何中心(除所有维数均是最小值的点外)。 DAs和多边形可视化提供产生可视化的线性组合的机构。 我们将取几个例子说明“可视化的线性组合”的观点。让用在一可视 化中用的维数总数为d,通常这也是所使用的维数锚的总数,然而,对有 些可视化来说,DAs的数量为2d。用来产生平行坐标可视化的参数是: Ppc={P1,P2,…P9}=[0,0,0,0,1,0,0,0,0] 然后平行坐标可视化可被定义为 Vpc=f(Ppc,Gpc(d)) 其中Gpc(d)是DAs的平行坐标排列的几何结构。 产生径向可视化的参数是: Prv={P1,P2,…P9}=[0,0,0,0,0,0,…5,0,…5] 径向可视化能被定义为 Vrv=f(Prv,Grv(d)) 其中Grv(d)是DAs的径向排列的几何结构。 根据平行坐标和多边形可视化定义的新的可视化是 Vnew=f(Vpc,Vrv) 线性组合的一个例子是 Vnew=.5Vpc+.5Vrv, 乘以标量和相加很容易定义参数矢量,给出该新可视化参数矢量为: Pnew=[0,0,0,0…5,0,.25,0,.25]=.5Ppc+.5Prv 可用许多方法定义DAs的几何结构的线性组合。例如,在图1显示了 一实施例,该实施例描述了在DAs的平行坐标结构上的可能变换。DAs平 滑地回绕成十字形。现在如果DAs逐渐地缩短成在十字形的外部端点上的 点,就能获得正常的径向可视化。变换的几何结构不相仿(平行线不能保 持平行),或投射。尽管每一单独DA转换被看作投射,但集合在一起的 DAs的点和线的入射不是恒定的。如果我们包括DAs的端点永远不能交叉 的约束条件,转换能被认为是拓扑的。如果我们定义我们的距离函数为在 图11中在变换间具有相同的值,我们就能定义新的可视化几何结构。 Gnew(d)=.5Gpc(d)+.5Grv(d) 技术上,Gpc(d)和Grv(d)是在DAs的原始排列上的变换。如果 我们设置Gpc(d)=0(我们的最初排列),我们得到 Gnew(d)=5Grv(d) 这是基本上从Gpc(d)到Grv(d)的转换(在图11中最低排列)。 平行坐标和径向可视化的线性组合如图12所示。DA布图是圆形的平 行坐标以及用于径向可视化弹簧和平行坐标的参数是正数。注意所示的弹 簧点非常接近DAs,并且,平行坐标没有完全连接。首先,用于显示的点 的大小(依靠点的数量)应当合适,而且,连接Pc线不应当具有间隔。 这表示更有用的显示也许是 Vpc+Vrv 其中径向可视化点大小是正常的,且平行坐标线完全连接。 对这两部分的可视化来说有一些有用的信息。如从平行坐标线在每一 维中了解相关值以及从径向可视化/弹性点中看出更多重要的相关维数 效果。 上面显示的维数锚允许新可视化的生成作为由维数锚的排列所描述 的任何可视化的线性组合。用维数锚(参数和几何结构)的相同代数,我 们也可平稳地将一个可视化转换成另一个。在一个例子示出,如何能容易 地将平行坐标转换成圆的平行坐标。它有助于使用称为封闭该维数锚的维 数界限的一个结构。 将平行坐标(PC)的维数布局认为连接到2线(顶部和底部维数限制) 的等距离隔开的直线能由一些参数定义的任意形状和长度。很容易看出维 数限制能从直线移到弧,且变成外圆和内圆。内圆能变得越来越小直到成 为一个点。然后,这就成为圆平行坐标或星形符号。使用二.次曲线部分或 更常用的二次多项式,我们能提供大量的相似可视化转换。维数限制的转 换通过这些二次曲线部分的平面的简单的路径进行。 使用上述定义的九个参数,我们能了解可视化空间是最低限度P9(即 九维数空间)。然而,那仅是用于维数锚。典型的数据集可能是10维, 因此要求10维数锚,每一个维数锚具有九个参数(空间=P9*10)。更重要 的是,DAs的不同排列将进一步增加可视化空间的维数。如果限制那些与 平等坐标和径向相似的布局排列,可视化空间将大大减少。另外,如果使 用每一个维数锚的相同的九个参数,我们能减少可视化空间到P12。可能 通过该可视化空间取出“主要的循环”。通过改变这九个参数,并且绘出 该维数锚的排列,就能慢慢地(依靠数据集大小和计算机速度)从一个可 视化转移到另一个可视化。先前描述的可视化证明在发现新的可视化方面 有用的有限手动循环。 参考图13,一个典型的数据可视化系统10包括经中继线14连接到 显示单元的计算机系统12。该计算机系统包括至少一个存储器18,一个 中央处理单元(CPU)20以及一个大容量存储装置22。该大容量存储装 置包括数据可视化指令24。在操作中数据可视化指令24被下载到存储器 18中,用于在CPU20中处理。在显示单元16上显示在CPU20中执行后的 输出。 已经描述过本发明的许多实施例。尽管如此,应能理解在不脱离本发 明的精神和范围的前提下可做出各种改变。例如,DAs和它们的相关参数 可以任意排列大小、形状和位置。我们仅研究了部分象平行坐标、圆弧、 正多边形、展宽多边形以及交叉形的这些“规则排列”。还有许多另外的 排列如弧、或以透镜形状排列和双曲线圆形显示形式排列的曲线。这些结 构将做成具体的“聚焦的”可视化。以多项式的形式或代数函数形成的维 数锚也将具有有用的特性。 在多种结构中,如我们分类为网格图的三角形或多边形中由平行坐标 类型线、分散绘图线以及弹簧线生成的各种可视化。可视化的特征在于改 变网格线的密度。 用于数据显示的弹簧范例已经很成功。通过扩展固定的弹簧“定位 点”,我们已经增加多边形的效率和用途。这充分降低了点重迭问题。 另外,通过显示在维数锚上定位点扩展的弹簧线的部分,增加多边形 的理解和用途。由于许多可视化点群集中在中心,根据屏幕实际状态,由 部分弹簧线提供的附加信息用处不大。 使用弹簧参数的维数锚的各种结构能以各种方式,如用交叉图案或沿 一直线压缩的DAs,按数据的顺序排列。 改型的圆弧可视化的用途以前已经研究过。它最有用的特征之一是给 出有特定分类维数的所有维数的(或变量)全部关联。颜色相关的列是该 观点的一个改变,当维数很小(低于30)时更有用,在某些情况中更容 易理解。因此,其它实施例包括在下述权利要求范围内。

相关技术
视化相关技术
乔治·格林斯坦发明人的其他相关专利技术