從品牌網站建設到網絡營銷策劃,從策略到執行的一站式服務
來源:公司資訊 | 2021.09.02
最近 IT 行業 有三個 事件 特別 值得 觀察 ,首先 是《北京市 外來 新生代 農民工 監測 報告 》,在這個報告 中官方 首次 將從事 軟件 和信息技術 服務行業 的人員 列入 農民工 范疇 ,這種 說法 雖然 得到 廣大 程序員 們的廣泛 認同 ,不過 為什么 軟件開發 與傳統 的農業生產 越來越 像,也值得 深思 。
其二 ,OpenAI發布 了自動編碼 系統 ,這是 一款 可以 將英文 需求 描述 直接 轉換 為代碼 的神奇 工具 。
雖然 Codex首發 版本 的表現 還不能 完全 盡如人意 ,但AI 編碼 技術 的發展 卻給開發者 們敲響 了警鐘 ,未來 只要 有創意和算力 ,也許 真的 就就萬事俱備 了,程序員 也許 并不是 一個 必選項 。
其三 ,國際 IT 咨詢機構 Forrest發布 了《云原生開發者 洞察 白皮書 》,對于 云原生時代 對于 開發者 的機遇 、挑戰 、升級 路徑 等等 問題 進行 了探討 ,對于 《開發者 白皮書 》中的觀點 筆者 深表 贊同 ,云原生到底 會如何 影響 未來 的開發模式 ,對于 這個問題,每一個開發者 應該 都會 有自己 的思考 。
筆者 認為 云原生時代 ,開發者 要學著利用 Codex這樣 的新工具 ,在云原生的大農場 上進行 編程 ,而云原生則提供 了一個 真正 能屏蔽 底層 的開發平臺 。
云原生時代 的開發 最重要的是「人」「云」合一 ,而「人」「云」合一 的關鍵 則在于 全棧 ,只有 真正 做到 全棧 融合 才能 將各技術領域內坑洼 不平 的丘陵 ,變成 真正 肥力 十足 的平原 ,挖掘出 工具 的潛力 ,發揮 云原生的價值 。
云原生想建 黃金農場 不容易
無論是 K8s、容器 還是 最近 火爆 全網 的Serverless、Dubbo,云原生相較 于傳統 技術 其最大 的優勢 在于 能夠 充分利用 云原生平臺 的組件 及工具 鏈,屏蔽 底層 技術 ,使開發者 耕耘 的土地 更像是 一片 廣袤 的農場 ,幫助 開發者 節省時間 ,但是 想屏蔽 底層 光憑嘴說遠遠不夠 ,尤其是在大數據 及AI 領域 更是如此。
根據 IDC 定義 ,大數據 是指 現有 技術 難以 處理 的數據 。
從歷史 來看 ,在谷歌 提出 大數據 三駕馬車 的論文 時,當時 的關系 型數據庫技術 的確 難以 處理 大規模 的數據 。
傳統 SQL 在谷歌 海量 的查詢 記錄 面前 ,根本 跑不出 結果 。
也正是 由于 數據 越來越大,人們 對于 數據庫 的看法 開始 轉變 ,從一開始 單純 認為 數據庫 是加工 車間 ,轉變 為數據庫 也需要 是儲存 倉庫 ,而數據 已經 是加工 完成 的成品 ,沒有 被重塑 修改 回滾 的需求 。
而隨著 大數據應用 的進一步 拓展 ,業界 發現 價值 密度 更低的非結構化數據 也有 儲存 及挖掘 的必要 。
比如 客服 的對話 可能是語音 、文字 甚至 是圖像 、視頻 ,這都不是 傳統意義 上數據庫 、數倉可以 處理 的結構化數據 ,因此 用于 儲存 非結構化 的數據湖出現 了。
在了解 數據存儲 模型 的演進 過程 后,我們可以看出 關系 型數據庫 、數據倉庫 與數據湖的底層 構建 模型 并不相同,大數據 領域 各個 技術棧幾乎 全部 是由開源社區 推動 的,數據 技術 的快速 發展 卻也帶來 了領域 內部 的無盡 割裂 。
數據 是AI 乃至 整個 IT 行業 的血液 ,是業務 開發 鏈條 上的重要一環,但各環節 的兼容性 不佳也引發 了很多 衍生 問題 。
這其中 最嚴重 的是數據處理 的時效性 問題 ,大數據工程師 往往 需要 在T+1日以后 才能 給出 報表 ,但是 產品經理 卻永遠 需要 實時 的用戶畫像 ,對于 時效性 的要求 成為 了技術 與業務 之間 永遠 無法 達成 的協議 。
當前 ,科技企業要處理 的數據量 還在 迅速 增長 ,從筆者 了解 到的情況 ,各大廠 的數據 量級 正在 以年化 80 %左右 的速度 增長 ,如果 按照 現在 的迭代 速度 ,大數據技術 棧繼續 分化 ,那么 云廠商 如果 拿不出 全棧 大數據 解決方案 ,開發者 的云原生開發 也就根本 無從談起 。
因此 只有 提供 包括 數據采集 、數據 規范 、數據開發、數據服務 、數據治理 、數據可視化 在內 的全棧 式大數據工具,將數據集成開發平臺 與應用 云平臺 與容器 大數據平臺 打包 交付 ,才是 有競爭力 的云原生產品 。
AI 落地 ,必走全棧 之路
如果說 大數據 需要 全棧 解決方案 是個錦上添花 的選項 ,那么 AI 對全棧 的需求 則是必選項 。
從目前 AI 的發展趨勢 來看 ,最新 的人工智能 模型 對于 算力 的要求 往往 都是 非常 高的,比如 谷歌 的T5 ,其整個 模型 的參數 數量 達到 了驚人 的110 億,甚至 谷歌 科學家 直接 在T5 的論文 指出 :“越大的模型 往往 表現 更好 。
這表現 擴大 規模 可能 仍然 是實現 更好 性能 的方式 。“
不過 一般 的創業公司 如果沒有 雄厚 的資金 實力 是不可能 搭建 這種 級別 的AI 訓練 平臺 。
像去年 火爆 一時 的GPT -3的出現 充分證明 了大力 就是 能夠 出奇跡 ,這個 訓練集45 TB ,參數 規模 1750 億,預訓練 結果 700 G的AI 模型 一經 問世 就成為 了大眾 矚目 的焦點 。
一時之間 用GPT -3作詩 、作曲 乃至 畫畫 的應用 層出不窮 ,不過 GPT -3的訓練 成本高 達上千萬美元 ,這也進一步 提升 了AI 領域 的入門 門檻 ,只有 巨頭 才能 玩得起AI 。
不過 另一個 角度 講這樣 的趨勢 也推進 了AI 全棧 技術 與云的結合 ,只有 將云、人與 智能終端 結合 到一起 ,才能 降低 門檻 ,促進 AI 行業 創新發展 。
而這種 結合實際 與全場景 全棧 AI 是同一 概念 ,只有 算力 不行 ,只有 框架 不行 ,只擅長 訓練 集群 也不行 ,只有 把這些 方面 結合 到一起 ,做到 沒有 短板 才能 做好 AI 云,才能 讓AI 充分發揮 威力 ,體現 價值 。
云原生呼喚 程序員 的創造性
從OpenAI官方 的說法 來看 ,Codex試圖 理解 需求 描述 中的邏輯 ,并盡可能 生成 最好 的代碼 。
與其 同門 師兄 Copilot一樣 ,Codex也是基于 GPT -3構建 的。
不過 目前 GPT -3的工作原理 也就決定 了Codex、Copilot等輔助工具 本質 上還是 播種機 和收割機 ,只能 高效率 的模仿 ,卻很難 進行 創造性 的自主 、獨立 工作 ,也就是說 目前 AI 在編程 領域 遠未 達到 AlphaGo時刻 ,因此 在這個編程工具輔助 能力 極大 發展 ,基礎 底座 被云原生打造成 一片 坦途 的情況 下,復制粘貼 式的開發 將逐漸 失去 價值 ,但對于 程序員 創造力 與整合 能力 卻要求 更高 了。
在云原生時代 ,有兩種 開發 方向 ,一是 云原生的底層 基礎 開發 ,這點 在上文的大數據 和AI 部分 已經 詳細介紹 過了 ,底層 技術 關鍵在于 整合 與打通 ,性能 與資源 的開銷 是最需要 考慮 的方面 。
二是基于 云原生的開發 ,這需要 對于 云原生各模塊 的進行 創造 式的組合 ,從而 形成 新的生產力 。
由于 輔助工具 最擅長 的就是 模仿 與簡單 的修補 ,這方面 AI 很可能比人類 程序員 強很多 ,因此 無論是 哪種 開發 方向 ,有創造力 的大神 級程序員 都會 比以往 更加 緊俏 。
人云 合一 ,方顯 原生 本色
去年 哈佛大學 孵化 的腦機接口創業 企業 BrainCo也發布 了其最新產品 BrainOS,其主要 的創新點在于 腦機協同 的操作系統 ;年初 華為發布了HarmonyOS2.0 操作系統 ,主打 是端端 協作 的分布式 操作系統 ;Codex、Copilot更是 將程序員 與AI 工具 結合 的大幕 正在 開啟 。
未來 ,人云 協同 將成為 云原生領域 的核心 ,而人云 協同 將推動 各行各業 的智能化 升級 。
不同于 數字化轉型 ,智能化 是以人為 中心 ,智能 需要 和人 協同工作 。
因此 ,也許 智能機器永遠 都無法 取代 人,但人與 云達到 最完善 、最完美 的共融 共創 的云原生,終將 改變 每個 領域 、每個 行業 以及 每個人 的生活方式 。
作者 :馬超 ,CSDN 博客 專家 ,阿里云 MVP 、華為云 MVP ,華為 2020 年技術社區 開發者 之星 。