問題
在linux源碼中這三個調用的執行過程是執行fork(),vfork(),clone()時,通過壹個系統調用表映射到sys_fork(),sys_vfork(),sys_clone(),再在這三個函數中去調用do_fork()去做具體的創建進程工作。
fork
fork創建壹個進程時,子進程只是完全復制父進程的資源,復制出來的子進程有自己的task_struct結構和pid,但卻復制父進程其它所有的資源。例如,要是父進程打開了五個文件,那麽子進程也有五個打開的文件,而且這些文件的當前讀寫指針也停在相同的地方。所以,這壹步所做的是復制。這樣得到的子進程獨立於父進程, 具有良好的並發性,但是二者之間的通訊需要通過專門的通訊機制,如:pipe,***享內存等機制, 另外通過fork創建子進程,需要將上面描述的每種資源都復制壹個副本。這樣看來,fork是壹個開銷十分大的系統調用,這些開銷並不是所有的情況下都是必須的,比如某進程fork出壹個子進程後,其子進程僅僅是為了調用exec執行另壹個可執行文件,那麽在fork過程中對於虛存空間的復制將是壹個多余的過程。但由於現在Linux中是采取了copy-on-write(COW寫時復制)技術,為了降低開銷,fork最初並不會真的產生兩個不同的拷貝,因為在那個時候,大量的數據其實完全是壹樣的。寫時復制是在推遲真正的數據拷貝。若後來確實發生了寫入,那意味著parent和child的數據不壹致了,於是產生復制動作,每個進程拿到屬於自己的那壹份,這樣就可以降低系統調用的開銷。所以有了寫時復制後呢,vfork其實現意義就不大了。
fork()調用執行壹次返回兩個值,對於父進程,fork函數返回子程序的進程號,而對於子程序,fork函數則返回零,這就是壹個函數返回兩次的本質。
在fork之後,子進程和父進程都會繼續執行fork調用之後的指令。子進程是父進程的副本。它將獲得父進程的數據空間,堆和棧的副本,這些都是副本,父子進程並不***享這部分的內存。也就是說,子進程對父進程中的同名變量進行修改並不會影響其在父進程中的值。但是父子進程又***享壹些東西,簡單說來就是程序的正文段。正文段存放著由cpu執行的機器指令,通常是read-only的。
vfork
vfork系統調用不同於fork,用vfork創建的子進程與父進程***享地址空間,也就是說子進程完全運行在父進程的地址空間上,如果這時子進程修改了某個變量,這將影響到父進程。
因此,上面的例子如果改用vfork()的話,那麽兩次打印a,b的值是相同的,所在地址也是相同的。
但此處有壹點要註意的是用vfork()創建的子進程必須顯示調用exit()來結束,否則子進程將不能結束,而fork()則不存在這個情況。
Vfork也是在父進程中返回子進程的進程號,在子進程中返回0。
用 vfork創建子進程後,父進程會被阻塞直到子進程調用exec(exec,將壹個新的可執行文件載入到地址空間並執行之。)或exit。vfork的好處是在子進程被創建後往往僅僅是為了調用exec執行另壹個程序,因為它就不會對父進程的地址空間有任何引用,所以對地址空間的復制是多余的 ,因此通過vfork***享內存可以減少不必要的開銷。
clone
系統調用fork()和vfork()是無參數的,而clone()則帶有參數。fork()是全部復制,vfork()是***享內存,而clone()是則可以將父進程資源有選擇地復制給子進程,而沒有復制的數據結構則通過指針的復制讓子進程***享,具體要復制哪些資源給子進程,由參數列表中的clone_flags來決定。另外,clone()返回的是子進程的pid。