用數據講故事是人工智能和數據專業人員的一項關鍵軟技能。為了確保利益相關者了解數據科學團隊工作的技術要求、價值和影響,數據科學家、數據工程師和機器學習( ML )工程師有必要進行有效溝通。
這篇文章提供了一個框架和技巧,您可以采用這些框架和技巧將數據故事的關鍵元素融入到您的下一個演示、演講或提案中。它旨在實現以下目標:
- 在數據科學和機器學習的背景下介紹故事
- 強調數據科學從業者有效講故事的好處
- 提供如何培養數據故事講述技能的技巧
什么是用數據講故事
數據故事講述是將上下文信息添加到關鍵數據和見解中的能力,以幫助項目干系人開發觀點和實現。數據科學家和人工智能從業者必須有效傳達數據驅動行動或推理的影響。
數據和機器學習從業者可以使用數據故事來更有效地與客戶、項目干系人、團隊成員和其他業務實體溝通。令人信服的敘述可以幫助你的觀眾理解復雜的概念,并有助于贏得新項目。
數據故事案例研究
本節探討數據驅動故事的關鍵結構組件。
文章 非洲100年后的樣子?利用數據和可視化,從拉各斯、達喀爾和開羅等非洲主要城市的角度講述了非洲正在發生的變革。
本文的戰略組成介紹了問題、背景和解決方案。這種方法為任何數據驅動的敘事提供了堅實的基礎。文章還包括事實、軼事、數據以及圖表。總之,這些都產生了一個自由流動、結構良好、引人入勝、信息豐富的主題描述。
本文的開頭部分描述了背景和要點:“非洲能否將其巨大的人口增長轉化為經濟發展和生活質量的提高?”
關鍵日期、數字和第一人稱陳述等信息創造了一幅真實的畫面,使讀者對主題有了充分的理解。使用圖表和圖表顯示數據,可以可視化非洲主要城市的變化。具體數據點包括人口增長、教育率和預期壽命。來自重點城市公民的個人經歷和第一手資料提供了額外的背景。
數據科學中講故事的有效框架
本節探討數據科學領域的故事講述應該如何結構化和呈現。目標是為您的下一次演示、文章或視頻向利益相關者提供一個易于遵循的框架。
講故事的成功秘訣可以歸納為三個獨立的部分: 背景、爭議和解決方案 (圖 1 )。這些組件可以與其他方法相結合,用數據講述一個引人注目的故事。
- 背景:為你的敘述奠定基礎并提供一些背景
- 爭議:討論與上下文相關的問題
- 解決方案:解釋并討論結束或緩解已確定問題的解決方案

上下文
在講故事中,上下文包括提供信息以加強、支持和揭示從數據樣本中提取的關鍵發現。在沒有上下文的情況下,整理的數據只是信息的字母數字表示的集合,僅此一項無法提供對問題或主題的任何可操作的見解。將數據與加強上下文和其他支持元素一起呈現可以幫助理解并幫助受眾得出有意義的結論。
講故事時,可以使用許多不同的方法來創建上下文。數據中的上下文是通過利用諸如演員、軼事、可視化、數據標簽、圖表等增強材料的集合而產生的。
舉個例子,考慮下面的句子:
“ 2021 ,英國售出 20 萬輛插入式電動汽車,同比增長約 140% 。”
添加上下文信息和支持軼事可以增加相關性,如以下段落所示:
“詹姆斯對電動汽車的興趣是由他在收音機上無意中聽到的一段關于氣候變化的對話引發的。他做了一些研究,發現大眾 ID.3 對他來說是一個不錯的選擇。詹姆斯決定購買這輛車,到 2021 中,他是眾多改用電動汽車的英國居民之一。 2021 電動汽車的銷量是他們的兩倍多 2020 年,由于公眾對氣候變化及其影響的認識不斷提高。”
圖表和圖表也很重要。它們可視化數據以幫助理解并提供額外支持(圖 2 )。

爭端
在數據故事的背景下,爭議是一個問題、沖突、爭論、辯論或問題。為了推動引入新工具或采用新方法的影響,它有助于提及關鍵爭議。
以下是有助于驅動初始電動汽車數據點的爭議示例:
“英國是用于能源和發電的化石燃料的凈進口國。化石燃料為我們的運輸、電氣和技術服務,甚至嚴重依賴化石燃料能源輸出的國內項目提供動力。問題是英國決心在 2050 年前大幅減少對化石燃料的依賴。因此,問題是英國如何減少化石燃料消耗,轉而使用低碳能源。此外,化石燃料是氣候變化和極端天氣的重要因素。”
解決方案
將故事講述與數據聯系起來時要考慮的第三個也是最后一個因素是解決方案。解決方案可以有多種形式,例如重新配置現有系統、實施新的方法,或者了解教育材料以及如何最好地使用它們。
建議的解決方案應該是直接的、顯而易見的和令人難忘的。如果提議的解決方案模棱兩可,利益相關者將提出更多問題。另一方面,直接解決方案允許采取行動并形成未來步驟。
以下是建議的解決方案示例:
“意識是英國制定到 2050 年減少化石燃料依賴的國家目標的第一步。為了接觸到更多像詹姆斯這樣的人,我們建議擴大 WWF 碳足跡應用程序的規模,以包括人工智能支持的功能,從而實現基于歷史數據和預測能源需求的家庭能耗預測等服務。這項擴大規模的計劃將需要 1 億英鎊的資金,并將在項目批準后一年向公眾交付。”
建議的解決方案包含對故事的引用,以便于記憶。它還包括有關項目成本和時間表的信息,以表明它是直接的。
示例大綱
使用下面的示例大綱作為下一個數據故事講述項目的參考。
打開部分
- 從關鍵數據點或數據集摘要的事實陳述開始,強調爭議的影響、缺乏解決方案或可能的解決方案的影響。例如,“ 2021 ,英國售出 305300 輛插入式電動汽車,同比增長約 140% 。”
- 通過包括幾個段落介紹、解釋和擴展上下文,擴展開頭部分。
中間部分
- 介紹、解釋并擴展爭議。
- 包括軼事、事實、數字、圖表和圖表,以將爭議的背景化并提出問題。
- 介紹、解釋和擴展與解決方案有關的爭議。
- 包括軼事、事實、數字、圖表和圖表,以說明建議的解決方案的影響和價值。
關閉部分
- 總結你的要點。展示解決方案將帶來的好處,以及沒有解決方案的不良后果。
- 將行動呼吁作為下一步,用數據封裝故事的預期結果。

總結
公司和組織每天都在變得更加數據驅動。因此,各級人工智能和數據專業人員需要發展數據故事講述技能,以彌合與技術、數據集和技術相關的理解差距。這篇文章中的信息將為您奠定堅實的基礎,從中開始構建您的數據故事講述技能。
?