文章段落
DevOps 組合自 Development 和 Operations,代表文化、實踐和工具的結合。而 CI/CD 是實踐 DevOps 持續改善原則的方法,代表持續整合與持續交付或部署。本次示範如何將 DevOps 流程放上 Google Cloud(原 GCP),以更輕鬆地達成 CI/CD!
DevOps 教學前言:CI/CD 是什麼?如何達成?
CI:即「持續整合」
CI(Continuous Integration)指的是持續整合,也就是將新版的程式碼自動建置和測試,確保程式碼沒有問題。CI 的主要目的是更快地發現和解決錯誤、改善軟體品質,並不斷進行小幅度的改動,進一步減少驗證和發布更新所需的時間。因此 CI 讓開發人員能在流程的早期發現整合問題和錯誤,並簡化代碼分支和建置。
CD:即「持續交付」或「持續部署」
CD 可視團隊狀況定義為持續交付(Continuous Delivery)或持續部署(Continuous Deployment)。其中持續交付代表將程式變更推送到測試環境,確保它是一個隨時可以部署到正式環境的狀態,而持續部署則是讓程式完全自動部署到正式環境(不用手動部署),也是更成熟的 CD Pipeline。
如何達成 CI/CD?
在《DevOps 教學:利用 GitLab、GKE 五步驟達成 CI/CD》中我們除了要自己辛苦打造 GitLab Server,過程中還超多地雷…….。這次要輕鬆一點,把整個 DevOps 流程都放在全代管 GCP 服務上,不要再自己建Server了。除此之外,會再善用 Git 分版本來達成 GitOps,把整個環境用 Code 來處理,也就是所謂 “environments-as-code”。
今天的實作是參考 “GitOps-style continuous delivery with Cloud Build” 來實作的,各位有疑問可以深入研究這篇文章。
整個 DevOps 環境如下:
data:image/s3,"s3://crabby-images/6d559/6d559c9f1b7e397ad938f77a6ec78f2c16e4eb16" alt="DevOps (GitOps) Process"
過程中會建2個 Git Repositories,首先程式碼Push到 app repository,Cloud Build 會跑測試、建image然後push到 Container Registry。接下來 Cloud Build 又會更新 Deployment 設定檔,並且把設定檔push到 env repository,這個動作會觸發另一個 Cloud Build pipeline去套用到 GKE Cluster,如果成功,會把設定檔存在env repository的另一個Git分支。
我們會讓 app 和 env repo 分開,因為它們的用途不同。App repo 的使用者是「真人」,env 的使用者是「假人」?咦不是啦!是自動化系統如 Cloud Build 和其他會用到它的應用程式。而且這 env repo有幾個分支分別對應到特定的環境,也會參考特定的 container image,而 app repo 則沒有。
看完之後,你應該會有一個系統能做到:
- 在 Cloud Build 的history區分出成功和失敗的deployment
- 在env repo的production分支存取當前的設定檔
- 重新執行對應的 build 動作回滾到先前的版本
整個 DevOps 流程如下:
data:image/s3,"s3://crabby-images/c49b8/c49b8d616ba56eb930074ab63f54ac5dbdb6c68e" alt="DevOps (GitOps) Pipeline"
DevOps 教學步驟一:基本環境建立
建立 GKE Cluster
gcloud container clusters create hello-cloudbuild –num-nodes 1 –zone us-central1-b
因為要等幾分鐘讓Cluster開好,等不及可以開另一個 Cloud Shell 登入 Git
git config –global user.email “xxx@xxx.com”
git config –global user.name “Aaron Lee”
data:image/s3,"s3://crabby-images/a4ce2/a4ce248682bb2cbdd497145096c83f9b056761dc" alt="git config"
執行 credential helper,它讓你的帳號連到 Cloud Source Repositories
data:image/s3,"s3://crabby-images/cddd9/cddd9f895d010f83de0043bfb5390a012377873c" alt=""
接著建立2個 repo,app和env
data:image/s3,"s3://crabby-images/1b17d/1b17d367e86b3d6bff57ea013967ddff6efbdc7a" alt=""
然後去
https://github.com/GoogleCloudPlatform/gke-gitops-tutorial-cloudbuild
把範例程式碼拉下來
data:image/s3,"s3://crabby-images/77bdf/77bdf6b478b5c1d7c6040c46ff749cbaf0f4badb" alt="clone sample code"
接下來設環境變數,一定要設好,後面就不用每次key source repo那個長長的網址:
cd ~/hello-cloudbuild-app
PROJECT_ID=$(gcloud config get-value project)
git remote add google \ “https://source.developers.google.com/p/${PROJECT_ID}/r/hello-cloudbuild-app”
data:image/s3,"s3://crabby-images/ed1bd/ed1bd4cddd8d4ecd574631c293b506a047f06ece" alt="設定環境變數"
進app.py稍微改一下名字,證明自己真的有做過~
vim app.py
data:image/s3,"s3://crabby-images/95e82/95e8237f258532d253cfacd25a803664d31b6c70" alt="app.py"
來看一下Dockerfile
data:image/s3,"s3://crabby-images/1842b/1842bf93f6610d81ab3882c42cd2fc575b14ded4" alt="app.py Dockerfile"
我們會用 Cloud Build 建image並儲存在 Container Registry。
然後我們要先把 commit id取出來,之後建image會用到它。
COMMIT_ID=”$(git rev-parse –short=7 HEAD)”
DevOps 教學步驟二:建立 Container Image
現在我們要建 image了!
加 tag 包含 commit id (這樣放到 GCR也可以識別)
gcloud builds submit –tag=”gcr.io/${PROJECT_ID}/hello-cloudbuild:${COMMIT_ID}” .
data:image/s3,"s3://crabby-images/34d9b/34d9b74e9e0837b8c12b10c995680c8c531a4588" alt="gcloud build tag"
完成!
data:image/s3,"s3://crabby-images/d55c9/d55c9240f4cb0d98bcddc292d6a0e8ae01bbc1d0" alt="gcloud build tag successfully"
DevOps 教學步驟三:建立 CI pipeline (就是建trigger)
直接去 Cloud Build 的頁面點擊 Create Trigger
data:image/s3,"s3://crabby-images/58f0c/58f0c471775294cf3bd0324f73fdfa13e411257c" alt="create trigger"
取名 hello-cloudbuild
data:image/s3,"s3://crabby-images/1150c/1150c1d0688c2f1ca488377b433f8eceaba342a3" alt="edit cloud build trigger"
在 Event 選擇 Push to a branch
data:image/s3,"s3://crabby-images/353cc/353ccb0d984e138098a6c0b2f6b320fa95a735df" alt="cloud build trigger event"
在 Source 部分選擇 hello-cloudbuild-app ,以及 ^master$ 做為 Branch
data:image/s3,"s3://crabby-images/0c5ce/0c5cee5d3b9f576f758e691813cafadba4985843" alt="cloud build source repository"
data:image/s3,"s3://crabby-images/303b6/303b697394af6017b28d3a8cb10a3e56f7f2f547" alt="cloud build source branch"
Build Configuration選擇 Cloud Build configuration file
檔名取 cloudbuild.yaml
data:image/s3,"s3://crabby-images/d11a5/d11a5d5a7ed915abf42693ccd632df5bd972861c" alt="CI cloudbuild.yaml"
OK的話就按 Create。
看一下這個檔案內容,這是 cloudbuild.yaml第一版的檔,只做CI
data:image/s3,"s3://crabby-images/6de7b/6de7bc0992385398d14dbe3db4906527128273c6" alt="CI cloudbuild.yaml details"
Trigger建好了,那我們來push code看看
data:image/s3,"s3://crabby-images/5473b/5473bb23de6621819090c3482eff17259f3f8012" alt="create trigger successfully"
但是因為 code 沒有變動,所以沒有觸發 Cloud Build 的Trigger來建image
那我故意再改一下:
data:image/s3,"s3://crabby-images/e7223/e7223b0d4a5cf86b6ad10357253edfd19aae1106" alt="Modify app.py"
送出了:
data:image/s3,"s3://crabby-images/8d3a4/8d3a4b95fe9da24a23a0bcb5f190bd433108e940" alt="commit app.py"
結果有問題
data:image/s3,"s3://crabby-images/c6a92/c6a92a504cbc6b1d1f4b43cdf9b00e48b077e1fc" alt="commit app.py and error"
測試失敗?
data:image/s3,"s3://crabby-images/2d606/2d6066562195ee45309597c9aa58aaddd38a9c45" alt="commit app.py and error"
我們仔細看一下 Log:
Step #0 – “Test”: self.assertEqual(hello(), “Hello World!\n”)
Step #0 – “Test”: AssertionError: “Hello World! I’m GKE Master Aaron Lee 1228\n” != ‘Hello World!\n’
Step #0 – “Test”: – Hello World! I’m GKE Master Aaron Lee 1228 Step #0 – “Test”: + Hello World!
原來是它檢查我的句子是不是”Hello World!”,只不要是都算錯。
那我還是乖乖改回來:
data:image/s3,"s3://crabby-images/0f224/0f224c42bd393b3275a41c2249ee5370465233bd" alt="modify app.py"
再commit並push出去:
data:image/s3,"s3://crabby-images/c41ce/c41cedf14aa97b30aefb8b9eba59f20875c107aa" alt="commit app.py again"
快去 Cloud Build 看看:
data:image/s3,"s3://crabby-images/682b5/682b56dfce84d4798ce764b5491b0e7b4e3dc5d6" alt="check cloud build"
果然成功了!
所以那個測試,是有寫一個規則在裡面嗎?
我找到 test_app.py ,來看看裡面有什麼:
data:image/s3,"s3://crabby-images/fc22a/fc22a1e65bc151ee1492a96b1e3d73a2c42aaca3" alt="test_app.py details"
原來就是檢查句子是不是 “Hello World!”
確認Image上來了:
data:image/s3,"s3://crabby-images/b7dbf/b7dbf1ecaf11ba722483dbf4d359ace22cc114e3" alt="confirm image created"
DevOps 教學步驟五:建立 CD Pipeline
接下來開始CD流程。
Cloud build 也可以用在CD pipeline, 每次commit push到 candidate分支就會開始跑。這個pipeline也會套用新的設定檔到GKE,如果成功的話,它會copy設定檔到production分支。整個流程有一些特性如下:
- Candidate分支會放所有要部署的歷史記錄
- Production分支則是只有成功的部署
- 你會在 Cloud Build 看到所有成功和失敗部署的細節
- 你可以重新執行 build 用來回滾到先前的版本,同時回滾也會更新production分支來真實反應deployment的歷史記錄。
接下來要注意的地方是,你會改掉前面建的 CI Pipeline,去更新candidate分支,觸發 CD pipeline。
授權 Cloud Build 來存取 GKE,像上次授權GitLab存取GCR和GKE是一樣的意思。
data:image/s3,"s3://crabby-images/a86e7/a86e7ffd86c99a5817f03967fe0acaae4a64e606" alt="grant permissions to Cloud Build service account"
接下來初始化 hello-cloudbuild-env repo,做2個分支
cd ~
gcloud source repos clone hello-cloudbuild-env
cd ~/hello-cloudbuild-env
git checkout -b production
“-b” 代表我建了一個分支叫 production,並且切換到這個分支
data:image/s3,"s3://crabby-images/4ad9b/4ad9b7c65aa7c1f90293c850100d61bc84ac87b0" alt="create another branch production"
目前在production分支 把app repo的cloudbuild-delivery.yaml copy過來 變成cloudbuild.yaml 只是把檔案copy一份,然後就commit上去
cd ~/hello-cloudbuild-env
cp ~/hello-cloudbuild-app/cloudbuild-delivery.yaml ~/hello-cloudbuild-env/cloudbuild.yaml
目前沒有trigger,不會有任何影響。
這個檔的內容主要是部署設定檔到GKE,成功的話再把檔案放到production分支。
data:image/s3,"s3://crabby-images/bb7ac/bb7ac41572b9657be47c67cc01dd54be0c2d20e5" alt="cloudbuild.yaml details"
git add
.git commit -m “Create cloudbuild.yaml for deployment”
data:image/s3,"s3://crabby-images/f4bcf/f4bcf32eb9c87d2cb64ed274a6771a4898f8953c" alt="commit cloudbuild.yaml"
再建一個 candidate 分支,並且切換過去:
git checkout -b candidate
把這兩個都push,注意 candidate 是空的,沒錯喔不要懷疑。
git push origin production git push origin candidate
然後授權 Source Repository Writer角色權限給 Cloud Build service account:
PROJECT_NUMBER="$(gcloud projects describe ${PROJECT_ID} \
--format='get(projectNumber)')"
cat >/tmp/hello-cloudbuild-env-policy.yaml <<EOF
bindings:
- members:
- serviceAccount:${PROJECT_NUMBER}@cloudbuild.gserviceaccount.com
role: roles/source.writer
EOF
gcloud source repos set-iam-policy \
hello-cloudbuild-env /tmp/hello-cloudbuild-env-policy.yaml
data:image/s3,"s3://crabby-images/92d82/92d827dca5e3aec0af3e23d75d20721b2a8975ee" alt="grant Source Repository Writer role Cloud Build service account"
接下來建立第二個Trigger:
data:image/s3,"s3://crabby-images/acead/aceadd492ebdfe9a47b7f1103eee525832ca3089" alt="create trigger hello-cloudbuild-deploy"
data:image/s3,"s3://crabby-images/4e5a6/4e5a6b3f9b871995cedafb4e33bbd0ec93f56c0c" alt="trigger event"
data:image/s3,"s3://crabby-images/c7c76/c7c760a8b950d235d729f399617e2607cc7db494" alt="cloud build trigger source repository"
data:image/s3,"s3://crabby-images/f3e7a/f3e7a56bd49fc070830d54246d94a1f8dd986151" alt="cloud build trigger source branch"
它的意思是,只要在env這個repo裡,有push到candidate這個分支,就執行cloudbuild.yaml (主要會部署 GKE, 並且在production 分支產生k8s.yaml做一個commit)
那這支 cloudbuild.yaml 目前還沒產生,接下來才會出現。(感覺在鋪一個很長的梗……)
DevOps 教學步驟六:更改 CI pipeline 去觸發 CD
現在要改檔名,把 cloudbuild-trigger-cd.yaml 改成 cloudbuild.yaml
就像上面說的,它會部署 GKE 並且copy到 production
我們看一下這個檔案,因為內容很多又雜,我分段貼出來並且加了一些註解,方便大家看懂(閱讀課開始……):
data:image/s3,"s3://crabby-images/be641/be6415ab29d15a5a47379376169c23563297ce38" alt="cloudbuild-trigger-cd.yaml details part1"
後面還有…
data:image/s3,"s3://crabby-images/67f48/67f4894051e7b205a1b4a8c22ff814e62a1a1575" alt="cloudbuild-trigger-cd.yaml details part2"
還有…
data:image/s3,"s3://crabby-images/b17e4/b17e49dd25ca5400954636ed92f558a3eae0c25d" alt="cloudbuild-trigger-cd.yaml details part3"
而我們的另一個Trigger,是在 ENV 裡提交 Candidate 之後所觸發執行的工作,來看一下內容(第二堂閱讀課……):
data:image/s3,"s3://crabby-images/24728/247285222223b102f30ad1b86c82b8497d97e729" alt="another trigger cloudbuild.yaml part1"
後面還有…
data:image/s3,"s3://crabby-images/e4760/e4760d1c056255033c32983e179fa9f374d8b205" alt="another trigger cloudbuild.yaml part2"
再忍耐一下,快看完了…
data:image/s3,"s3://crabby-images/51879/51879d64a97f653c9276f786c1ffd86e9cd48c31" alt="another trigger cloudbuild.yaml part3"
然後把這個push到 app 自己的 repo:
cd ~/hello-cloudbuild-app
git add cloudbuild.yaml
git commit -m “Trigger CD pipeline”
git push google master
這樣把app自己的檔案commit出來,就會Trigger 原本app裡的cloudbuild.yaml (只有CI),以及Env裡的Candidate Trigger (CD: 部署到GKE):
data:image/s3,"s3://crabby-images/9918d/9918d900e46b218f86b8682acca037f134b53f2c" alt="commit cloudbuild.yaml to trigger CICD pipeline"
接下來看到 Cloud Build 開始跑了:
data:image/s3,"s3://crabby-images/42d1d/42d1d5b9ff413b4f0125d3f196b8224bd1fa5c20" alt="Cloud Build running"
過幾秒之後看到成功:
data:image/s3,"s3://crabby-images/e5b4f/e5b4ff4f39175a6e4d84aacb29b9067f63b8149f" alt="Cloud Build running successfully"
後來發現 Cluster 忘記建了,快來建一下。
(忘記是小事,因為前面就可以花好幾天的時間確認流程,太早建Cluster就只能放在那邊浪費錢,就是等到它提示再建就好了)
data:image/s3,"s3://crabby-images/9f657/9f657674b09300e26218e4c0317cd6c664e659ba" alt="create GKE cluster"
等開好,來按一下retry (貼心的功能不用再重新commit或push)
data:image/s3,"s3://crabby-images/ee157/ee157fbf32ca6662ae8b378db1801a7c1eb126f5" alt="retry cloud build"
成功了!
data:image/s3,"s3://crabby-images/db4ea/db4ea57cd7a9e1e067ac9242f9c09143d4f0f4fa" alt="retry cloud build successfully"
來看一下Service,看到 Load Balancer 有建起來,並且有一個外部IP:
data:image/s3,"s3://crabby-images/917e0/917e0ce6a82f16fedbf0c6a41d1cbb4b4a193986" alt="confirm GKE service"
點擊下去看到網頁,終於成功了!
data:image/s3,"s3://crabby-images/758ee/758ee5d004de01b2121584563bf05bf43f664c88" alt="confirm GKE service successfully"
以上就是完整的CI/CD流程,過程中有任何錯誤都可以看得到,因為在 GCP 上多了 DevOps 提到的「透明化」原則,而且都是用代管式的 GCP 服務來達成,其中比較複雜的是 Google 又加入了 Git 管理 (所以在過程中看起來有點亂),又形成了 GitOps,透過Infra structure as a cod 提高了自動化,並減少大量手工(Toil)出錯的風險,對我們未來的產品開發速度大有幫助。
如果還不習慣全代管,要使用 GitLab 的話,可以回來看這篇文章: