reader軟件怎么用 reader怎么使用
2023-08-22
更新時間:2023-08-22 18:08:02作者:未知
前面兩節(jié)簡要地從C語言源代碼層面討論了Linux系統(tǒng)中進程的基本概念,我們知道了Linux內(nèi)核如何描述和記錄進程的資源,以及進程的五種基本狀態(tài)和進程的家族樹。事實上,就進程管理而言,Linux還是有一些獨特之處的。
Linux 是如何創(chuàng)建進程的呢?
許多操作系統(tǒng)都提供了專門的進程產(chǎn)生機制,比較典型的過程是:首先在內(nèi)存新的地址空間里創(chuàng)建進程,然后讀取可執(zhí)行程序,裝載到內(nèi)存中執(zhí)行。
Linux 系統(tǒng)創(chuàng)建線程并未使用上述經(jīng)典過程,而是將創(chuàng)建過程拆分到兩組獨立的函數(shù)中執(zhí)行:fork() 函數(shù)和 exec() 函數(shù)族。
基本流程是這樣的:首先,fork() 函數(shù)拷貝當前進程創(chuàng)建子進程。產(chǎn)生的子進程與父進程的區(qū)別僅在與 PID 與 PPID 以及某些資源和統(tǒng)計量,例如掛起的信號等。準備好進程運行的地址空間后,exec() 函數(shù)族負責讀取可執(zhí)行程序,并將其加載到相應的位置開始執(zhí)行。
fork() 函數(shù)和 exec() 函數(shù)族
Linux 系統(tǒng)創(chuàng)建進程使用的這兩組函數(shù)效果與其他操作系統(tǒng)的經(jīng)典進程創(chuàng)建方式效果是相似的,可能有讀者會覺得這么做會讓進程創(chuàng)建過于繁瑣,其實不是的,Linux 這么做的其中一個原因是為了提高代碼的復用率,這得益于 Linux 高度概括的抽象,無需再額外設(shè)計一套機制用于創(chuàng)建進程。
早期 Linux 中的 fork() 函數(shù)直接把父進程的所有資源賦值給創(chuàng)建出的子進程,這樣的機制自然是簡單的,但是效率卻比較低下。
原因是顯而易見的:子進程并不一定要使用父進程的資源,或者子進程可能僅需以只讀的方式訪問父進程的資源,這時“拷貝一份資源”就純屬多余的開銷了。
針對這樣的問題,Linux 后續(xù)版本中的 fork() 函數(shù)開始采用“寫時拷貝”機制。寫時拷貝技術(shù)可以將拷貝需求延遲,甚至免除拷貝,減小開銷。
“寫時拷貝”機制
具體來說就是,Linux 在調(diào)用 fork() 創(chuàng)建子進程時,并不著急拷貝整個進程地址空間,而是暫時讓父子進程以只讀的方式共享同一個拷貝??截悇幼髦辉谧舆M程需要寫入時才會發(fā)生,以確保各個進程有自己獨立的內(nèi)存空間。
如果子進程用不到或者只需要讀取共享空間數(shù)據(jù),那么拷貝動作就被省去了,Linux 就減小了開銷。例如,系統(tǒng)調(diào)用 fork() 后立即調(diào)用 exec(),此時 exec() 會加載新的映像覆蓋 fork() 的地址空間,拷貝動作完全可以省去。
事實上,fork() 函數(shù)的實際開銷就是復制父進程的頁表以及給子進程創(chuàng)建唯一的進程描述符。在大多數(shù)情況下,Linux 創(chuàng)建進程后都會馬上運行新的可執(zhí)行程序,因此“寫時拷貝”機制可以避免相當多的數(shù)據(jù)拷貝。創(chuàng)建進程速度快是 Linux 系統(tǒng)的一個特征,因此“寫時拷貝”是一種相當重要的優(yōu)化。
創(chuàng)建進程時,內(nèi)存地址空間里常常包含數(shù)十 MB 的數(shù)據(jù),如果每創(chuàng)建一次進程,就拷貝一次數(shù)據(jù),開銷顯然是非常大的。
Linux 中的 fork() 函數(shù)其實是基于 clone() 實現(xiàn)的,clone() 函數(shù)可以通過一系列參數(shù)標志指定父子進程需要共享的資源,在 Linux 中輸入 man 命令可以查看 clone() 函數(shù)的C語言原型:
clone() 函數(shù)的C語言原型
以及相關(guān)的參數(shù)標志:
相關(guān)的參數(shù)標志
在Linux中,fork() 函數(shù)最終調(diào)用了 do_fork() 函數(shù),它的C語言代碼如下,請看(do_fork() 函數(shù)的C語言代碼比較長,下面面只列出了一部分):
do_fork() 函數(shù)的C語言代碼
do_fork() 函數(shù)完成了進程創(chuàng)建的大部分工作,從相關(guān)的C語言源代碼可以看出,它調(diào)用了 copy_process() 函數(shù),copy_process() 函數(shù)的C語言源代碼如下,請看:
copy_process() 函數(shù)的C語言源代碼
copy_process() 函數(shù)的代碼也是比較長的,在我手上的Linux系統(tǒng)中,達到了近 400 行,不過代碼的整體邏輯是清晰的:
(1)copy_process() 函數(shù)首先檢查了一些標志位,接著調(diào)用 dup_task_struct() 函數(shù)為新進程創(chuàng)建內(nèi)核棧,以及上一節(jié)提到的 thread_info 和 task_struct 結(jié)構(gòu):
調(diào)用 dup_task_struct() 函數(shù)為新進程創(chuàng)建內(nèi)核棧
創(chuàng)建后,接下來的 arch_dup_task_struct() 函數(shù)會將 orig 結(jié)構(gòu)拷貝給新創(chuàng)建的結(jié)構(gòu),查看相關(guān)C語言代碼,這一過程是清晰的:
拷貝給新創(chuàng)建的結(jié)構(gòu)
此時子進程和父進程的描述符是完全相同的。
(2)接下來,需要檢查一些標志位和統(tǒng)計信息,相關(guān)的C語言代碼如下,請看:
檢查一些標志位和統(tǒng)計信息
(3)將一些統(tǒng)計量清零,以及初始化一些區(qū)別成員,此時雖然新進程的 task_struct 結(jié)構(gòu)體大多成員未被修改,但是父子進程已經(jīng)有所區(qū)別。這一過程的相關(guān)C語言代碼片段如下,請看:
將一些統(tǒng)計量清零,以及初始化一些區(qū)別成員
(4)將新創(chuàng)建的子進程狀態(tài)設(shè)置為 TASK_UNINTERRUUPTIBLE,確保其暫時不會被投入運行,這一過程的C語言代碼相對簡單。
(5)調(diào)用 alloc_pid() 函數(shù)為新進程分配一個獨一無二的 pid,相關(guān)C語言代碼如下,請看:
為新進程分配一個獨一無二的 pid
(6)根據(jù) clone() 函數(shù)的參數(shù)標志位,拷貝或共享已經(jīng)打開的文件、文件系統(tǒng)、信號處理函數(shù)、進程地址空間等資源,例如下面這段C語言代碼:
拷貝或共享已經(jīng)打開的資源
(7)將為新進程創(chuàng)建的 task_struct 結(jié)構(gòu)體的指針返回給調(diào)用者,也即 do_fork() 函數(shù)。此時新創(chuàng)建的進程還沒有被投入運行。
現(xiàn)在回到 do_fork() 函數(shù)。如果調(diào)用 clone() 函數(shù)時,沒有傳遞 CLONE_STOPPED 參數(shù),新創(chuàng)建的進程將被喚醒,并投入運行,這一過程的C語言代碼如下:
喚醒,并投入運行
到這里,一個新的進程就被 Linux 創(chuàng)建完畢了。
Linux 內(nèi)核有意讓新創(chuàng)建的子進程先運行,因為子進程常常會立即調(diào)用 exec() 函數(shù)加載新的程序到內(nèi)存中運行,這樣就避免了寫時拷貝的額外開銷。如果父進程首先執(zhí)行,顯然極有可能開始往地址空間寫入操作,導致拷貝動作發(fā)生。
本節(jié)詳細的從C語言代碼層面分析了Linux內(nèi)核創(chuàng)建進程的過程,可見,即使是復雜的操作系統(tǒng)代碼,也是通過一系列基本C語言語法和函數(shù)實現(xiàn)的。那么,Linux 是如何創(chuàng)建線程的呢?之前我們曾經(jīng)提到,Linux 系統(tǒng)并不特別區(qū)分進程和線程,線程其實是一種特殊的進程,Linux 是如何實現(xiàn)這一“特殊”過程的呢?限于篇幅,下一節(jié)再說了,敬請關(guān)注。
點個贊再走吧
歡迎在評論區(qū)一起討論,質(zhì)疑。文章都是手打原創(chuàng),每天最淺顯的介紹C語言、linux等嵌入式開發(fā),喜歡我的文章就關(guān)注一波吧,可以看到最新更新和之前的文章哦。