一级一级毛片-一级一级一级毛片-一级一级一级毛片免费毛片-一级一级一片在线观看-麻豆精品在线观看-麻豆精品永久免费视频

大眾可視化:精美酷炫的可視化圖表,自動生成!

原文鏈接:https://mp.weixin.qq.com/s/_Sw794CN0VcZq6SSEorN1A

編者按:作為一種信息載體,數據可視化可以將枯燥的文字轉變成高顏值且直觀的圖表,實現“一圖勝千言”。但要想制作“好的可視化”內容需要極其專業的數據分析能力和圖表設計能力,對普通人來說門檻較高。本文中,微軟亞洲研究院數據、知識、智能組研究員為大家介紹他們在大眾可視化領域的一些探索,讓可視化融入普通人的生活中。

在過去十幾年的發展中,數據可視化作為一個新興學科,在信息表達能力方面已經得到了廣泛認可,完成了從零到一的轉變。但由于相對較高的制作門檻,可視化內容的制作仍然只能由少數專業人士完成,限制了數據可視化的發展。要想實現從一到一萬的蛻變,數據可視化必然要走向大眾化。

雖然可視化內容的制作過程比較復雜,但是理解的門檻相對較低。研究表明,超過90%的信息是以視覺元素的方式進入人腦的,所以無需專業訓練,普通人天生就有從圖形圖像中尋找信息和發現規律的能力。另外,相比于枯燥的文字,人們往往更容易被精致的圖形設計所吸引,也有更強的興趣去理解和閱讀可視化內容。這些都讓可視化技術有一個龐大的潛在用戶群體,也預示了可視化內容作為一種大眾消費內容的巨大潛力。

有數據表明,2010年以來,網絡上的可視化內容的數量增長了一百多倍,而2019年更是有有超過八成的博客帖子至少帶有一個可視化圖表。由此可見,可視化的大眾化不僅僅是我們的愿景,而已經是一個正在慢慢發生的趨勢了。

什么是可視化,為什么要可視化?

提到數據可視化,大家首先想到的可能會是餅圖、柱狀圖之類的傳統圖表。不可否認,這些是,而且一直會是數據可視化的重要手段。但是,隨著新的數據類型不斷出現,以及在計算機技術的加持之下,新的數據可視化技術也在不斷的涌現(如圖1 所示)。但萬變不離其宗,可視化的本質也一直沒有發生改變:將抽象的數據或信息用直觀的視覺元素展示出來,以幫助人們快速地理解內容、發現規律、交流信息。一個好的可視化內容能夠高度概括紛繁復雜的數據,同時將隱藏的規律變得清晰明了。在這個大數據已經成為基本生產資料的時代,可視化愈發體現出了它不可替代的價值。


圖1:推特主題演化的可視化

對于數據分析師而言,可視化技術能幫他們理解每天都在源源不斷生成的大量的新數據。雖然機器學習方法能夠從茫茫原始數據中提煉出關鍵信息,但是這些信息只有在經過人們的理解并產生最后的決策的時候才能真正體現它們的價值,而可視化恰恰能幫人們完成這最后的臨門一腳。首先,它能將枯燥復雜的數據變得清晰友好,幫助人們快速全面地掌握關鍵信息;其次,可視化系統往往支持實時處理和交互分析,這都能夠幫助決策者跟蹤變化和理解變化背后的原因。統計數據表明,在可視化技術的幫助下,人們有28%的概率能夠更及時地做出判斷和決策。

另一方面,普通人對可視化的需求也是巨大的。在這個大數據時代,人人可以很方便地在互聯網上找到各種信息。但快節奏的生活也導致人們不愿意花太多時間去去理解各種信息。有研究表明,人們平均只會花37秒在一篇網絡文章上。那么如何能在37秒內把想表達的信息順利準確的傳遞給讀者呢?答案就是可視化。作為一個高效的信息載體,可視化恰好滿足了人們這種快餐信息的需求。

大眾可視化的挑戰

雖然可視化有上面所說的諸多優點,但并不是說所有的可視化內容都能提供這種好處。假如我們只是簡單地把數據一股腦的堆在畫布上,這種所謂的可視化很可能適得其反,反而增加了人們閱讀的難度。所以,我們在上文中的描述都有一個前提,那就是“好的可視化”,即需要在設計和數據中找到一個平衡點。

首先,一個好的可視化應該能夠高效地表達出它想傳達的消息,它既不能復雜到失去焦點,也不能簡單到丟失信息;其次,一個好的可視化應該符合人的習慣,能自我解釋。換言之,人們不用借助說明書就能夠毫無障礙地閱讀;再次,一個好的可視化應該美觀,優美的設計能夠極大地增強對讀者的吸引力。如果把可視化比作是一種數據到設計的翻譯,那么我們可以認為這些是可視化在“信達雅”上的要求。

對于普通人而言,想要制作一個符合上述要求的可視化內容絕對不是一件容易的事情。從獲取信息到制作可視化內容,主要面臨三大挑戰:首先是信息獲取的障礙,如何操作復雜的數據分析軟件從數據中抽取重要的信息?其次是設計挑戰,什么樣的設計能既美觀又高效地表達我們想要傳達的信息?最后是制作挑戰,如何通過各種工具制作最終的可視化內容?要想讓所有人都能夠隨時隨地地便捷使用可視化內容,實現大眾可視化,這三大障礙都必須被克服。

我們在大眾可視化上的嘗試

大眾可視化的關鍵在于要讓所有人都能毫無障礙地制作好的可視化。但是,人們使用信息可視化的場景千差萬別,而不同的場景中人們碰到的障礙也不盡相同。在這里,我們選取了兩個常見場景進行了一些初步探索。

Text-to-Viz

假設這樣一個場景:某人正在準備一篇文章或是演講幻燈片。在這個過程中,他覺得有一個觀點應該被重點強調。這時加入一個信息圖會是一個很好的選擇?,F在,他需要先上網去尋找一些信息圖的設計靈感,然后使用合適的工具將這個設計做出來。這一過程會耗費不少時間和精力,很多可視化的潛在用戶可能會因此放棄這一選項。

針對這個場景,我們設定了一個目標,那就是將這個制作過程完全自動化。這個可視化的制作過程就如同一條全自動流水線,輸出的產品是可視化內容,而輸入的原材料我們選擇了對用戶要求最低的自然語言。

當然,由于信息的總類五花八門,所以在這次探索里,我們選定了在信息圖表中最常見的一類關于比例的信息。例如,用戶的輸入是“3 out of 5 Chinese people live in rural areas“(每五個中國人中就有三個住在農村地區)這句話,那我們就會自動的設計出合適的信息圖(如圖2所示)。


圖2:信息圖

從用戶的輸入到信息圖的輸出,這顯然不是一件簡單的任務,中間涉及到了許多的技術難點。為此,我們設計了一套復雜的流程。首先通過自然語言分析從文本中提取關鍵的信息,諸如整體是什么、部分是什么、比例是多少等等;然后,我們收集了網絡上大量的設計案例,在這些案例的基礎上我們總結并設計出了一套自動設計的算法,將信息分別轉化成圖形、布局、顏色等等,最終合成許多可能的信息圖;最后我們對信息圖在若干個維度上評估打分,輸出系統推薦出來的最好結果。

詳細內容請參考論文Text-to-Viz: Automatic Generation of Infographics from Proportion-Related Natural Language Statements (IEEE VIS 2019)。

論文鏈接:https://arxiv.org/abs/1907.09091

DataShot

如今我們經常在網絡上看到類似于“有關互聯網的十個事實“的各種各樣的數據海報。這些海報用各種視覺元素簡明描繪了各種信息,以達到教育、宣傳的目的。但是這種海報的制作也是一個極其復雜的工程。并不是所有人都像數據分析師一樣,能夠用各種復雜的工具對數據行分析,提煉故事,然后將其清晰簡要的展示出來。所以我們也嘗試去自動化這個過程。

在這個場景中,我們假想人們只有數據但并不知道數據內部的故事,而我們目標是從一個原始表格數據中自動挖掘信息,整理信息,最后自動生成一個生動的描述數據內故事的一個圖形海報(如圖3所示)。


圖3:數據海報

與上一個場景相同,為了讓這個過程全自動,我們也設計了若干新的技術。首先我們分析了數據海報的組成成分,對數據中可能產生的故事建了一個模型。當給定一個數據集的時候,我們嘗試從數據中收集各種類型的事實或是規律。然后將挖掘出的事實整理成有條理的故事。最后,我們實現了一套基于決策樹的設計的系統,將整理出的故事可視化,然后自動布局到海報上。

詳細內容請參考論文DataShot: Automatic Generation of Fact Sheets from Tabular Data (IEEE VIS 2019)。

論文鏈接:http://aka.ms/AA6xrgi

當然,人們在現實生活中會遇到更多樣和更復雜的場景,我們在上述兩個場景中做了一些初步的嘗試無法覆蓋到所有的數據類型或情況。但我們相信,可視化的未來在于普通人的使用場景中。如今顯示設備和計算設備已經在人們的生活中廣泛普及,如果可視化制作的障礙也能夠被移除,那么,憑借它強大表達能力,可視化一定會惠及每一個普通人,成為我們日常使用的一大工具。

主站蜘蛛池模板: 二区三区视频| 色cccwww在线播放| 色妞精品一区二区| 国产成人精品第一区二区| 久久噜噜久久久精品66| 色老大综合久久综合热| 怡红院日本| 成人福利在线观看| 91人碰| 国产精品国产自线拍手机观看| 精品国产高清自在线一区二区三区| 日日噜噜夜夜狠狠tv视频免费| 亚洲综合91社区精品福利| 91av国产精品| 91免费福利视频| chinese国产一区二区| 国产大片视频免费观看| 国产亚洲精品视频中文字幕| 久久伊人影视| 美国美女一级毛片免费全| 日本欧美高清视频| 日韩久久中文字幕| 色播六月| 手机国产乱子伦精品视频| 亚洲一区不卡视频| 91在线高清| 成人欧美视频免费看黄黄| 国产精品自拍第一页| 国产亚洲精品网站| 国产精品拍自在线观看| 国产一级鲁丝片| 国产一区美女视频| 国产午夜一级鲁丝片| 国产自线一二三四2021| 好吊妞haodiaokan| 国产在线播放免费| 国产日韩一区二区三区| 国产视频合集| 国产激烈床戏无遮挡网站| 福利视频欧美| 99精品视频在线成人精彩视频|