马场大亨,久久永久免费视频

【清華大學(xué)】操作系統(tǒng)全集公開(kāi)課

１　馮諾伊曼體系１．１　馮諾伊曼體系簡(jiǎn)介現(xiàn)代計(jì)算機(jī)之父馮諾..

韓順平一周學(xué)會(huì)Linux

Linux簡(jiǎn)介L(zhǎng)inux內(nèi)核最初是由芬蘭人李納斯·托瓦茲（..

Linux Shell腳本入門到精通

Linux Shell腳本入門到精通內(nèi)容豐富全面，基本概念..

Redis入門到精通【黑馬】

什么是Redis?Redis 是完全開(kāi)源免費(fèi)的，遵守BSD..

linux云計(jì)算全套視頻教程

在互聯(lián)網(wǎng)的大環(huán)境下，云計(jì)算、大數(shù)據(jù)、物聯(lián)網(wǎng)、人工智能等概念..

linux系統(tǒng)編程全套視頻教程（187講）

&..

linux系統(tǒng)編程187課

什么是操作系統(tǒng)？概念：操作系統(tǒng)是管理和控制計(jì)算機(jī)硬件資源的..

浙大 - 嵌入式系統(tǒng)（32學(xué)時(shí)）

vSphere基礎(chǔ)[【選擇高清模式】入門視頻教程

本套課程為vSphere基礎(chǔ)[【選擇高清模式】入門視頻教程..

浙大 - 嵌入式系統(tǒng)（32學(xué)時(shí)）

Redis入門到精通【黑馬】

什么是Redis?Redis 是完全開(kāi)源免費(fèi)的，遵守BSD..

2014兄弟連Linux全套視頻教程

兄弟連2014年新版Linux視頻教程下載地址 ..

Linux【高清】常用指令講解視頻教程

本套視頻教程介紹了Linux系統(tǒng)下幾乎所有的常..

計(jì)算機(jī)體系結(jié)構(gòu)---國(guó)防科技大學(xué)

&..

云計(jì)算基礎(chǔ)教程

《云計(jì)算基礎(chǔ)教程》介紹了云計(jì)算的基本概念、原理..

Linux運(yùn)維工程師入門級(jí)課程

&..

１　馮諾伊曼體系

１．１　馮諾伊曼體系簡(jiǎn)介

現(xiàn)代計(jì)算機(jī)之父馮諾伊曼最先提出程序存儲(chǔ)的思想，并成功將其運(yùn)用在計(jì)算機(jī)的設(shè)計(jì)之中，該思想約定了用二進(jìn)制進(jìn)行計(jì)算和存儲(chǔ)，還定義計(jì)算機(jī)基本結(jié)構(gòu)為　５　個(gè)部分，分別是中央處理器（ＣＰＵ）、內(nèi)存、輸入設(shè)備、輸出設(shè)備、總線。

存儲(chǔ)器：代碼跟數(shù)據(jù)在ＲＡＭ跟ＲＯＭ中是線性存儲(chǔ)，　數(shù)據(jù)存儲(chǔ)的單位是一個(gè)二進(jìn)制位。最小的存儲(chǔ)單位是字節(jié)。

總線：總線是用于　ＣＰＵ　和內(nèi)存以及其他設(shè)備之間的通信，總線主要有三種：

地址總線：用于指定　ＣＰＵ　將要操作的內(nèi)存地址。

數(shù)據(jù)總線：用于讀寫內(nèi)存的數(shù)據(jù)。

控制總線：用于發(fā)送和接收信號(hào)，比如中斷、設(shè)備復(fù)位等信號(hào)，ＣＰＵ　收到信號(hào)后響應(yīng)，這時(shí)也需要控制總線。

輸入／輸出設(shè)備：輸入設(shè)備向計(jì)算機(jī)輸入數(shù)據(jù)，計(jì)算機(jī)經(jīng)過(guò)計(jì)算后，把數(shù)據(jù)輸出給輸出設(shè)備。比如鍵盤按鍵時(shí)需要和　ＣＰＵ　進(jìn)行交互，這時(shí)就需要用到控制總線。

ＣＰＵ：中央處理器，類比人腦，作為計(jì)算機(jī)系統(tǒng)的運(yùn)算和控制核心，是信息處理、程序運(yùn)行的最終執(zhí)行單元。ＣＰＵ用寄存器存儲(chǔ)計(jì)算時(shí)所需數(shù)據(jù)，寄存器一般有三種：

通用寄存器：用來(lái)存放需要進(jìn)行運(yùn)算的數(shù)據(jù)，比如需進(jìn)行加法運(yùn)算的兩個(gè)數(shù)據(jù)。

程序計(jì)數(shù)器：用來(lái)存儲(chǔ)　ＣＰＵ　要執(zhí)行下一條指令所在的內(nèi)存地址。

指令寄存器：用來(lái)存放程序計(jì)數(shù)器指向的指令本身。

在馮諾伊曼體系下電腦指令執(zhí)行的過(guò)程：

ＣＰＵ讀取程序計(jì)數(shù)器獲得指令內(nèi)存地址，ＣＰＵ控制單元操作地址總線從內(nèi)存地址拿到數(shù)據(jù)，數(shù)據(jù)通過(guò)數(shù)據(jù)總線到達(dá)ＣＰＵ被存入指令寄存器。

ＣＰＵ分析指令寄存器中的指令，如果是計(jì)算類型的指令交給邏輯運(yùn)算單元，如果是存儲(chǔ)類型的指令交給控制單元執(zhí)行。

ＣＰＵ　執(zhí)行完指令后程序計(jì)數(shù)器的值通過(guò)自增指向下個(gè)指令，比如３２位ＣＰＵ會(huì)自增４。

自增后開(kāi)始順序執(zhí)行下一條指令，不斷循環(huán)執(zhí)行直到程序結(jié)束。

ＣＰＵ位寬：３２位ＣＰＵ一次可操作計(jì)算４個(gè)字節(jié)，６４位ＣＰＵ一次可操作計(jì)算８?jìng)€(gè)字節(jié)，這個(gè)是硬件級(jí)別的。平常我們說(shuō)的３２位或６４位操作系統(tǒng)指的是軟件級(jí)別的，指的是程序中指令多少位。

線路位寬：ＣＰＵ操作指令數(shù)據(jù)通過(guò)高低電壓變化進(jìn)行數(shù)據(jù)傳輸，傳輸時(shí)候可以串行傳輸，也可以并行傳輸，多少個(gè)并行等于多少個(gè)位寬。

１．２　ＣＰＵ　簡(jiǎn)介

Ｃｅｎｔｒａｌ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ　中央處理器，作為計(jì)算機(jī)系統(tǒng)的運(yùn)算和控制核心，是信息處理、程序運(yùn)行的最終執(zhí)行單元。

ＣＰＵ

ＣＰＵ核心：一般一個(gè)ＣＰＵ會(huì)有多個(gè)ＣＰＵ核心，平常說(shuō)的多核是指在一枚處理器中集成兩個(gè)或多個(gè)完整的計(jì)算引擎。核跟ＣＰＵ的關(guān)系是：核屬于ＣＰＵ的一部分。

寄存器：最靠近ＣＰＵ對(duì)存儲(chǔ)單元，３２位ＣＰＵ寄存器可存儲(chǔ)４字節(jié)，６４位寄存器可存儲(chǔ)８字節(jié)。寄存器訪問(wèn)速度一般是半個(gè)ＣＰＵ時(shí)鐘周期，屬于納秒級(jí)別，

Ｌ１緩存：每個(gè)ＣＰＵ核心都有，用來(lái)緩存數(shù)據(jù)跟指令，訪問(wèn)空間大小一般在３２～２５６ＫＢ，訪問(wèn)速度一般是２～４個(gè)ＣＰＵ時(shí)鐘周期。

ｃａｔ　／ｓｙｓ／ｄｅｖｉｃｅｓ／ｓｙｓｔｅｍ／ｃｐｕ／ｃｐｕ０／ｃａｃｈｅ／ｉｎｄｅｘ０／ｓｉｚｅ　＃　Ｌ１　數(shù)據(jù)緩存

ｃａｔ　／ｓｙｓ／ｄｅｖｉｃｅｓ／ｓｙｓｔｅｍ／ｃｐｕ／ｃｐｕ０／ｃａｃｈｅ／ｉｎｄｅｘ１／ｓｉｚｅ　＃　Ｌ１　指令緩存

Ｌ２緩存：每個(gè)ＣＰＵ核心都有，訪問(wèn)空間大小在１２８ＫＢ～２ＭＢ，訪問(wèn)速度一般是１０～２０個(gè)ＣＰＵ時(shí)鐘周期。

ｃａｔ　／ｓｙｓ／ｄｅｖｉｃｅｓ／ｓｙｓｔｅｍ／ｃｐｕ／ｃｐｕ０／ｃａｃｈｅ／ｉｎｄｅｘ２／ｓｉｚｅ　＃　Ｌ２　緩存容量大小

Ｌ３緩存：多個(gè)ＣＰＵ核心共用，訪問(wèn)空間大小在２ＭＢ～６４ＭＢ，訪問(wèn)速度一般是２０～６０個(gè)ＣＰＵ時(shí)鐘周期。

ｃａｔ　／ｓｙｓ／ｄｅｖｉｃｅｓ／ｓｙｓｔｅｍ／ｃｐｕ／ｃｐｕ０／ｃａｃｈｅ／ｉｎｄｅｘ３／ｓｉｚｅ　＃　Ｌ３　緩存容量大小

內(nèi)存：多個(gè)ＣＰＵ共用，現(xiàn)在一般是４Ｇ～５１２Ｇ，訪問(wèn)速度一般是２００～３００個(gè)ＣＰＵ時(shí)鐘周期。

固體硬盤ＳＳＤ：現(xiàn)在臺(tái)式機(jī)主流都會(huì)配備，上述的寄存器、緩存、內(nèi)存都是斷電數(shù)據(jù)立馬丟失的，而ＳＳＤ里不會(huì)丟失，大小一般是１２８Ｇ～１Ｔ，比內(nèi)存慢１０～１０００倍。

機(jī)械盤ＨＤＤ：很早以前流行的硬盤了，容量可在５１２Ｇ～８Ｔ不等，訪問(wèn)速度比內(nèi)存慢１０Ｗ倍不等。

訪問(wèn)數(shù)據(jù)順序：ＣＰＵ在拿數(shù)據(jù)處理的時(shí)候幾乎也是按照上面說(shuō)得流程來(lái)操縱的，只有上面一層找不到才會(huì)找下一層。

Ｃａｃｈｅ　Ｌｉｎｅ　：　　ＣＰＵ讀取數(shù)據(jù)時(shí)會(huì)按照　Ｃａｃｈｅ　Ｌｉｎｅ　方式把數(shù)據(jù)加載到緩存中，每個(gè)Ｃａｃｈｅｌｉｎｅ　＝　６４ＫＢ，因?yàn)椋蹋薄ⅲ蹋彩敲總€(gè)核獨(dú)有到可能會(huì)觸發(fā)偽共享，就是　所以可能會(huì)將數(shù)據(jù)劃分到不同到ＣａｃｈｅＬｉｎｅ中來(lái)避免偽共享，比如在ＪＤＫ８　新增加的　ＬｏｎｇＡｄｄｅｒ　就涉及到此知識(shí)點(diǎn)。

偽共享：緩存系統(tǒng)中是以緩存行（ｃａｃｈｅ　ｌｉｎｅ）為單位存儲(chǔ)的，當(dāng)多線程修改互相獨(dú)立的變量時(shí)，如果這些變量共享同一個(gè)緩存行，就會(huì)無(wú)意中影響彼此的性能，這就是偽共享。

ＪＭＭ：　數(shù)據(jù)經(jīng)過(guò)種種分層會(huì)導(dǎo)致訪問(wèn)速度在不斷提升，同時(shí)也帶來(lái)了各種問(wèn)題，多個(gè)ＣＰＵ同時(shí)操作相同數(shù)據(jù)可能會(huì)造成各種ＢＵ個(gè)，需要加鎖，這里在ＪＵＣ并發(fā)已詳細(xì)探討過(guò)。

１．３　ＣＰＵ　訪問(wèn)方式

ＣＰＵ訪問(wèn)方式

內(nèi)存數(shù)據(jù)映射到ＣＰＵ　Ｃａｃｈｅ　時(shí)通過(guò)公式Ｂｌｏｃｋ　Ｎ　％　ＣａｃｈｅＬｉｎｅＭａｘ決定內(nèi)存Ｂｌｏｃｋ數(shù)據(jù)放到那個(gè)ＣＰＵ　Ｃａｃｈｅ　Ｌｉｎｅ　里。ＣＰＵ　Ｃａｃｈｅ　主要有４部分組成。

Ｃａｃｈｅ　Ｌｉｎｅ　Ｉｎｄｅｘ　：ＣＰＵ緩存讀取數(shù)據(jù)時(shí)不是按照字節(jié)來(lái)讀取的，而是按照ＣａｃｈｅＬｉｎｅ方式存儲(chǔ)跟讀取數(shù)據(jù)的。

Ｖａｌｉｄ　Ｂｉｔ　：　有效位標(biāo)志符，值為０時(shí)表示無(wú)論　ＣＰＵ　Ｌｉｎｅ　中是否有數(shù)據(jù)，ＣＰＵ　都會(huì)直接訪問(wèn)內(nèi)存，重新加載數(shù)據(jù)。

Ｔａｇ：組標(biāo)記，用來(lái)標(biāo)記內(nèi)存中不同ＢＬｏｃｋ映射到相同ＣａｃｈｅＬｉｎｅ，用Ｔａｇ來(lái)區(qū)分不同的內(nèi)存Ｂｌｏｃｋ。

Ｄａｔａ：真實(shí)到內(nèi)存數(shù)據(jù)信息。

ＣＰＵ真實(shí)訪問(wèn)內(nèi)存數(shù)據(jù)時(shí)只需要指定三個(gè)部分即可。

Ｃａｃｈｅ　Ｌｉｎｅ　Ｉｎｄｅｘ　：要訪問(wèn)到Ｃａｃｈｅ　Ｌｉｎｅ　位置。

Ｔａｇ：表示用那個(gè)數(shù)據(jù)塊。

Ｏｆｆｓｅｔ：ＣＰＵ從ＣＰＵ　Ｃａｃｈｅ　讀取數(shù)據(jù)時(shí)不是直接讀取Ｃａｃｈｅ　Ｌｉｎｅ整個(gè)數(shù)據(jù)塊，而是讀取ＣＰＵ所需的數(shù)據(jù)片段，稱為Ｗｏｒｄ。如何找到Ｗｏｒｄ就需要個(gè)偏移量Ｏｆｆｓｅｔ。

１．４　ＣＰＵ　訪問(wèn)速度

訪問(wèn)耗時(shí)對(duì)比

如上圖所示，ＣＰＵ訪問(wèn)速度是逐步變慢，所以ＣＰＵ訪問(wèn)數(shù)據(jù)時(shí)需盡量在距離ＣＰＵ近的高速緩存區(qū)訪問(wèn)，根據(jù)摩爾定律ＣＰＵ訪問(wèn)速度每１８?jìng)€(gè)月就會(huì)翻倍，而內(nèi)存的訪問(wèn)每１８?jìng)€(gè)月也就增長(zhǎng)１０％　左右，導(dǎo)致的結(jié)果就是ＣＰＵ跟內(nèi)存訪問(wèn)性能差距逐步變大，那如何盡可能提高ＣＰＵ緩存命中率呢？

１．　數(shù)據(jù)緩存：遍歷數(shù)據(jù)時(shí)候按照內(nèi)存布局順序訪問(wèn)，因?yàn)椋茫校铡。茫幔悖瑁迨歉鶕?jù)Ｃａｃｈｅ　Ｌｉｎｅ批量操作數(shù)據(jù)的，所以你順序讀取數(shù)據(jù)會(huì)提速，道理跟磁盤順序?qū)懸粯印?/p>

指令緩存：盡可能的提供有規(guī)律的條件分支語(yǔ)句，讓　ＣＰＵ　的分支預(yù)測(cè)器發(fā)揮作用，進(jìn)一步提高執(zhí)行的效率，因?yàn)椋茫校帐亲詭Х种ьA(yù)測(cè)器，自動(dòng)提前將可能需要的指令放到指令緩存區(qū)。

線程綁定到ＣＰＵ：一個(gè)任務(wù)Ａ在前一個(gè)時(shí)間片用ＣＰＵ核心１　運(yùn)行，后一個(gè)時(shí)間片用ＣＰＵ核心２　運(yùn)行，這樣緩存Ｌ１、Ｌ２就浪費(fèi)了。因此操作系統(tǒng)提供了將進(jìn)程或者線程綁定到某一顆　ＣＰＵ　上運(yùn)行的能力。如　Ｌｉｎｕｘ　上提供了　ｓｃｈｅｄ＿ｓｅｔａｆｆｉｎｉｔｙ　方法實(shí)現(xiàn)這一功能，其他操作系統(tǒng)也有類似功能的　ＡＰＩ　可用。當(dāng)多線程同時(shí)執(zhí)行密集計(jì)算，且　ＣＰＵ　緩存命中率很高時(shí)，如果將每個(gè)線程分別綁定在不同的　ＣＰＵ　核心上，性能便會(huì)獲得非常可觀的提升。

１．５　　操作系統(tǒng)

計(jì)算機(jī)結(jié)構(gòu)

有了馮諾伊曼計(jì)算機(jī)體系后，電腦想要為用戶提供便捷的服務(wù)還需要安裝個(gè)操作系統(tǒng)Ｏｐｅｒａｔｉｏｎ　Ｓｙｓｔｅｍ，操作系統(tǒng)是覆蓋在硬件上的一層特殊軟件，它管理計(jì)算機(jī)的硬件和軟件資源，為其他應(yīng)用程序提供大量服務(wù)。可以理解為操作系統(tǒng)是日常應(yīng)用程序跟硬件之間的接口。日常你經(jīng)常在用Ｗｉｎｄｏｗｓ／Ｌｉｎｕｘ　系統(tǒng)，操作系統(tǒng)給我們提供了超級(jí)大的便利，但是你了解操作系統(tǒng)么？操作系統(tǒng)是如何進(jìn)行內(nèi)存管理、進(jìn)程管理、文件管理、輸入輸出管理的呢？

２　內(nèi)存管理

你的電腦是３２位操作系統(tǒng)，那可支持的最大內(nèi)存就是４Ｇ，你有沒(méi)有好奇為什么可以同時(shí)運(yùn)行２個(gè)以上的２Ｇ內(nèi)存的程序。應(yīng)用程序不是直接使用的物理地址，操作系統(tǒng)為每個(gè)運(yùn)行的進(jìn)程分配了一套虛擬地址，每個(gè)進(jìn)程都有自己的虛擬內(nèi)存地址，進(jìn)程是無(wú)法直接進(jìn)行物理內(nèi)存地址的訪問(wèn)的。至于虛擬地址跟物理地址的映射，進(jìn)程是感知不到的！操作系統(tǒng)自身會(huì)提供一套機(jī)制將不同進(jìn)程的虛擬地址和不同內(nèi)存的物理地址進(jìn)行映射。

虛擬內(nèi)存

２．１　　ＭＭＵ

Ｍｅｍｏｒｙ　Ｍａｎａｇｅｍｅｎｔ　Ｕｎｉｔ　內(nèi)存管理單元是一種負(fù)責(zé)處理ＣＰＵ內(nèi)存訪問(wèn)請(qǐng)求的計(jì)算機(jī)硬件。它的功能包括虛擬地址到物理地址的轉(zhuǎn)換、內(nèi)存保護(hù)、中央處理器高速緩存的控制。現(xiàn)代　ＣＰＵ　基本上都選擇了使用　ＭＭＵ。

當(dāng)進(jìn)程持有虛擬內(nèi)存地址的時(shí)候，ＣＰＵ?qǐng)?zhí)行該進(jìn)程時(shí)會(huì)操作虛擬內(nèi)存，而ＭＭＵ會(huì)自動(dòng)的將虛擬內(nèi)存的操作映射到物理內(nèi)存上。

ＭＭＵ

這里提一下，Ｊａｖａ操作的時(shí)候你看到的地址是ＪＶＭ地址，不是真正的物理地址。

２．２　　內(nèi)存管理方式

操作系統(tǒng)主要采用內(nèi)存分段和內(nèi)存分頁(yè)來(lái)管理虛擬地址與物理地址之間的關(guān)系，其中分段是很早前的方法了，現(xiàn)在大部分用的是分頁(yè)，不過(guò)分頁(yè)也不是完全的分頁(yè)，是在分段的基礎(chǔ)上再分頁(yè)。

２．２．１　內(nèi)存分段

ＪＶＭ內(nèi)存模型

我們以上圖的ＪＶＭ內(nèi)存模型舉例，程序員會(huì)認(rèn)為我們的代碼是由代碼段、數(shù)據(jù)段、棧段、堆段組成。不同的段是有不同的屬性的，用戶并不關(guān)心這些元素所在內(nèi)存的位置，而分段就是支持這種用戶視圖的內(nèi)存管理方案。邏輯地址空間是由一組段構(gòu)成。每個(gè)段都有名稱和長(zhǎng)度。地址指定了段名稱和段內(nèi)偏移。因此用戶段編號(hào)和段偏移來(lái)指定不同屬性的地址。而虛擬內(nèi)存地址跟物理內(nèi)存地址中間是通過(guò)段表進(jìn)行映射的，口說(shuō)無(wú)憑，看圖吧。

內(nèi)存分段管理

如上虛擬地址有　５　個(gè)段，各段按如圖所示來(lái)存儲(chǔ)。每個(gè)段都在段表中有一個(gè)條目，它包括段在物理內(nèi)存內(nèi)的開(kāi)始的基地址和該段的界限長(zhǎng)度。例如段　２　為　４００　字節(jié)長(zhǎng)，開(kāi)始于位置　４３００。因此對(duì)段　２　字節(jié)　５３　的引用映射成位置　４３００　＋　５３　＝　４３５３。對(duì)段　３　字節(jié)　８５２　的引用映射成位置　３２００　＋　８５２　＝　４０５２。

分段映射很簡(jiǎn)單，但是會(huì)導(dǎo)致內(nèi)存碎片跟內(nèi)存交互效率低。這里先普及下在內(nèi)存管理中主要有內(nèi)部?jī)?nèi)存碎片跟外部?jī)?nèi)存碎片。

內(nèi)部碎片：已經(jīng)被分配出去的的內(nèi)存空間不經(jīng)常使用，并且分配出去的內(nèi)存空間大于請(qǐng)求所需的內(nèi)存空間。

外部碎片：指可用空間還沒(méi)有分配出去，但是可用空間由于大小太小而無(wú)法分配給申請(qǐng)空間的新進(jìn)程的內(nèi)存空間空閑塊。

以上圖為例，現(xiàn)在系統(tǒng)空閑是１４００　＋　　８００　＋　６００　＝　２８００。那如果有個(gè)程序想要連續(xù)的使用２０００，內(nèi)存分段模式下提供不了啊！上述三個(gè)是外部?jī)?nèi)存碎片。當(dāng)然可以使用系統(tǒng)的Ｓｗａｐ空間，先把段０寫入到磁盤，然后再重新給段０分配空間。這樣可以實(shí)現(xiàn)最終可用，可是但凡涉及到磁盤讀寫就會(huì)導(dǎo)致內(nèi)存交互效率低。

ｓｗａｐ空間利用

２．２．２　內(nèi)存分頁(yè)

內(nèi)存分頁(yè)，整個(gè)虛擬內(nèi)存和物理內(nèi)存切成一段段固定尺寸的大小。每個(gè)固定大小的尺寸稱之為頁(yè)Ｐａｇｅ，在　Ｌｉｎｕｘ　系統(tǒng)中Ｐａｇｅ　＝　４ＫＢ。然后虛擬內(nèi)存跟物理內(nèi)存之間通過(guò)頁(yè)表來(lái)實(shí)現(xiàn)映射。

采用內(nèi)存分頁(yè)時(shí)內(nèi)存的釋放跟使用都是以頁(yè)為單位的，也就不會(huì)產(chǎn)生內(nèi)存碎片了。當(dāng)空間還不夠時(shí)根據(jù)操作系統(tǒng)調(diào)度算法，可能將最少用的內(nèi)存頁(yè)面　ｓｗａｐ－ｏｕｔ換出到磁盤，用時(shí)候再ｓｗａｐ－ｉｎ換入，盡可能的減少磁盤刷寫量，提高內(nèi)存交互效率。

分頁(yè)模式下虛擬地址主要有頁(yè)號(hào)跟頁(yè)內(nèi)偏移量?jī)刹糠纸M成。通過(guò)頁(yè)號(hào)查詢頁(yè)表找到物理內(nèi)存地址，然后再配合頁(yè)內(nèi)偏移量就找到了真正的物理內(nèi)存地址。

分頁(yè)內(nèi)存尋址

３２位操作系統(tǒng)環(huán)境下進(jìn)程可操作的虛擬地址是４ＧＢ，假設(shè)一個(gè)虛擬頁(yè)大小為４ＫＢ，那需要４ＧＢ／４ＫＢ　＝　２＾２０　個(gè)頁(yè)信息。一行頁(yè)表記錄為４字節(jié)，２＾２０等價(jià)于４ＭＢ頁(yè)表存儲(chǔ)信息。這只是一個(gè)進(jìn)程需要的，如果１０個(gè)、１００個(gè)、１０００個(gè)呢？?jī)H僅是頁(yè)表存儲(chǔ)都占據(jù)超大內(nèi)存了。

為了解決這個(gè)問(wèn)題就需要用到　多級(jí)頁(yè)表，核心思想就是局部性分配。在３２位的操作系統(tǒng)中將將４Ｇ空間分為　１０２４　行頁(yè)目錄項(xiàng)目（４ＫＢ），每個(gè)頁(yè)目錄項(xiàng)又對(duì)應(yīng)１０２４行頁(yè)表項(xiàng)。如下圖所示：

３２位系統(tǒng)二級(jí)分頁(yè)

控制寄存器ｃｒ３中存放了頁(yè)目錄的物理地址，通過(guò)ｃｒ３寄存器可以找到頁(yè)目錄，而３２位線性地址中的Ｄｉｒｅｃｔｏｒｙ部分決定頁(yè)目錄中的目錄項(xiàng)，而頁(yè)目錄項(xiàng)中存放了要找的頁(yè)表的物理基地址，再結(jié)合線性地址中的中間１０位頁(yè)表項(xiàng)，就可以找到頁(yè)框的頁(yè)表項(xiàng)。線性地址中的Ｏｆｆｓｅｔ部分占１２位，因此頁(yè)框的物理地址　＋　線性地址Ｏｆｆｓｅｔ部分　＝　頁(yè)框中的任何一個(gè)字節(jié)。

分頁(yè)后一級(jí)頁(yè)就等價(jià)于４Ｇ虛擬地址空間，并且如果一級(jí)頁(yè)表中那些地址沒(méi)有就不需要再創(chuàng)建二級(jí)頁(yè)表了！核心思想就是按需創(chuàng)建，當(dāng)系統(tǒng)給每個(gè)進(jìn)程分配４Ｇ空間，進(jìn)程不可能占據(jù)全部?jī)?nèi)存的，如果一級(jí)目錄頁(yè)只有１０％用到了，此時(shí)頁(yè)表空間　＝　一級(jí)頁(yè)表４ＫＢ　＋　０．１　＊　４ＭＢ　　。這比單獨(dú)的每個(gè)進(jìn)程占據(jù)４Ｍ好用多了！

多層分頁(yè)的弊端就是訪問(wèn)時(shí)間的增加。

使用頁(yè)表時(shí)讀取內(nèi)存中一頁(yè)內(nèi)容需要２次訪問(wèn)內(nèi)存，訪問(wèn)頁(yè)表項(xiàng)　＋　并讀取的一頁(yè)數(shù)據(jù)。

使用二級(jí)頁(yè)表的話需要三次訪問(wèn)，訪問(wèn)頁(yè)目錄項(xiàng)　＋　訪問(wèn)頁(yè)表項(xiàng)　＋　訪問(wèn)并讀取的一頁(yè)數(shù)據(jù)。訪存次數(shù)的增加也就意味著訪問(wèn)數(shù)據(jù)所花費(fèi)的總時(shí)間增加。

而對(duì)于６４位系統(tǒng)，二級(jí)分頁(yè)就無(wú)法滿足了，Ｌｉｎｕｘ　從２．６．１１開(kāi)始采用四級(jí)分頁(yè)模型。

Ｐａｇｅ　Ｇｌｏｂａｌ　Ｄｉｒｅｃｔｏｒｙ　全局頁(yè)目錄項(xiàng)

Ｐａｇｅ　Ｕｐｐｅｒ　Ｄｉｒｅｃｔｏｒｙ　上層頁(yè)目錄項(xiàng)

Ｐａｇｅ　Ｍｉｄｄｌｅ　Ｄｉｒｅｃｔｏｒｙ　中間頁(yè)目錄項(xiàng)

Ｐａｇｅ　Ｔａｂｌｅ　Ｅｎｔｒｙ　頁(yè)表項(xiàng)

Ｏｆｆｓｅｔ　偏移量。

６４位尋址

２．２．２　ＴＬＢ

Ｔｒａｎｓｌａｔｉｏｎ　Ｌｏｏｋａｓｉｄｅ　Ｂｕｆｆｅｒ　可翻譯為地址轉(zhuǎn)換后援緩沖器，簡(jiǎn)稱為快表，屬于ＣＰＵ內(nèi)部的一個(gè)模塊，ＴＬＢ是ＭＭＵ的一部分，實(shí)質(zhì)是ｃａｃｈｅ，它所緩存的是最近使用的數(shù)據(jù)的頁(yè)表項(xiàng)（虛擬地址到物理地址的映射）。他的出現(xiàn)是為了加快訪問(wèn)數(shù)據(jù)（內(nèi)存）的速度，減少重復(fù)的頁(yè)表查找。當(dāng)然它不是必須要有的，但有它，速度就更快。

ＴＬＢ

ＴＬＢ很小，因此緩存的東西也不多。主要緩存最近使用的數(shù)據(jù)的數(shù)據(jù)映射。ＴＬＢ結(jié)構(gòu)如下圖：

ＴＬＢ查詢

如果一個(gè)需要訪問(wèn)內(nèi)存中的一個(gè)數(shù)據(jù)，給定這個(gè)數(shù)據(jù)的虛擬地址，查詢ＴＬＢ，發(fā)現(xiàn)有ｈｉｔ，直接得到物理地址，在內(nèi)存根據(jù)物理地址取數(shù)據(jù)。如果ＴＬＢ沒(méi)有這個(gè)虛擬地址ｍｉｓｓ，那么只能費(fèi)力的通過(guò)頁(yè)表來(lái)查找了。日常ＣＰＵ讀取一個(gè)數(shù)據(jù)的流程如下：

ＣＰＵ讀取數(shù)據(jù)流程圖

當(dāng)進(jìn)程地址空間進(jìn)行了上下文切換時(shí)，比如現(xiàn)在是進(jìn)程１運(yùn)行，ＴＬＢ中放的是進(jìn)程１的相關(guān)數(shù)據(jù)的地址，突然切換到進(jìn)程２，ＴＬＢ中原有的數(shù)據(jù)不是進(jìn)程２相關(guān)的，此時(shí)ＴＬＢ刷新數(shù)據(jù)有兩種辦法。

全部刷新：很簡(jiǎn)單，但花銷大，很多不必刷新的數(shù)據(jù)也進(jìn)行刷新，增加了無(wú)畏的花銷。

部分刷新：根據(jù)標(biāo)志位，刷新需要刷新的數(shù)據(jù)，保留不需要刷新的數(shù)據(jù)。

２．２．３　段頁(yè)式管理

內(nèi)存分段跟內(nèi)存分頁(yè)不是對(duì)立的，這倆可以組合起來(lái)在同一個(gè)系統(tǒng)中使用的，那么組合起來(lái)后通常稱為段頁(yè)式內(nèi)存管理。段頁(yè)式內(nèi)存管理實(shí)現(xiàn)的方式：

先對(duì)數(shù)據(jù)不同劃分出不同的段，也就是前面說(shuō)的分段機(jī)制。

然后再把每一個(gè)段進(jìn)行分頁(yè)操作，也就是前面說(shuō)的分頁(yè)機(jī)制。

此時(shí)　地址結(jié)構(gòu)　＝　段號(hào)　＋　段內(nèi)頁(yè)號(hào)　＋　頁(yè)內(nèi)位移。

每一個(gè)進(jìn)程有一張段表，每個(gè)段又建立一張頁(yè)表，段表中的地址是頁(yè)表的起始地址，而頁(yè)表中的地址則為某頁(yè)的物理頁(yè)號(hào)。

段頁(yè)式管理

同時(shí)我們經(jīng)常看到兩個(gè)專業(yè)詞邏輯地址跟線性地址。

邏輯地址：指的是沒(méi)被段式內(nèi)存管理映射的地址。

線性地址：通過(guò)段式內(nèi)存管理映射且頁(yè)式內(nèi)存管理轉(zhuǎn)換前的地址，俗稱虛擬地址。

目前　Ｉｎｔｅｌ　Ｘ８６　ＣＰＵ　采用的是內(nèi)存分段　＋　　內(nèi)存分頁(yè)的管理方式，其中分頁(yè)的意思是在由段式內(nèi)存管理所映射而成的的地址上再加上一層地址映射。

Ｘ８６內(nèi)存管理方式

２．２．４　Ｌｉｎｕｘ　內(nèi)存管理

先說(shuō)結(jié)論：Ｌｉｎｕｘ系統(tǒng)基于Ｘ８６　ＣＰＵ　而做的操作系統(tǒng)，所以也是用的段頁(yè)式內(nèi)存管理方式。

我們知道３２位的操作系統(tǒng)可尋址范圍是４Ｇ，操作系統(tǒng)會(huì)將４Ｇ的可訪問(wèn)內(nèi)存空間分為用戶空間跟內(nèi)核空間。

內(nèi)核空間：操作系統(tǒng)內(nèi)核訪問(wèn)的區(qū)域，獨(dú)立于普通的應(yīng)用程序，是受保護(hù)的內(nèi)存空間。內(nèi)核態(tài)下ＣＰＵ可執(zhí)行任何指令，可自由訪問(wèn)任何有效地址。

用戶空間：普通應(yīng)用程序可訪問(wèn)的內(nèi)存區(qū)域。被執(zhí)行代碼會(huì)受到ＣＰＵ眾多限制，進(jìn)程只能訪問(wèn)映射其地址空間的頁(yè)表項(xiàng)中規(guī)定的在用戶態(tài)下可訪問(wèn)頁(yè)面的虛擬地址。

那為啥要搞倆空間呢？現(xiàn)在嵌入式環(huán)境跟以前的ＷＩＮ９８系統(tǒng)是沒(méi)有區(qū)分倆空間的，須知倆空間是ＣＰＵ分的，而操作系統(tǒng)是在上面運(yùn)行的，單一用戶、單一任務(wù)服務(wù)的操作系統(tǒng)，是沒(méi)有分所謂用戶態(tài)和內(nèi)核態(tài)的必要。用戶態(tài)和內(nèi)核態(tài)是因?yàn)橛卸嘤脩簦嗳蝿?wù)的需求，然后在ＣＰＵ硬件廠商配合之后，產(chǎn)生的一個(gè)操作系統(tǒng)解決多用戶多任務(wù)需求的方案。方案就是限制，通過(guò)硬件手段（也只能硬件手段才能做到），限制某些代碼，使其無(wú)法控制整個(gè)物理硬件，進(jìn)而使各個(gè)不同用戶，不同任務(wù)的代碼，無(wú)權(quán)修改整個(gè)物理硬件，再進(jìn)而保護(hù)操作系統(tǒng)的核心底層代碼和其他用戶的數(shù)據(jù)不被無(wú)意或者有意地破壞和盜取。

后來(lái)研究者根據(jù)ＣＰＵ的運(yùn)行級(jí)別，分成了Ｒｉｎｇ０～Ｒｉｎｇ３四個(gè)級(jí)別。Ｒｉｎｇ０是最高級(jí)別，Ｒｉｎｇ１次之，Ｒｎｇ２更次之，拿Ｌｉｎｕｘ＋ｘ８６來(lái)說(shuō)，　　操作系統(tǒng)內(nèi)核的代碼運(yùn)行在最高運(yùn)行級(jí)別Ｒｉｎｇ０上，可以使用特權(quán)指令，控制中斷、修改頁(yè)表、訪問(wèn)設(shè)備等。　應(yīng)用程序的代碼運(yùn)行在最低運(yùn)行級(jí)別上Ｒｉｎｇ３上，不能做受控操作，只能訪問(wèn)用戶被分配的空間。如果要做訪問(wèn)磁盤跟寫文件等操作，那就要通過(guò)執(zhí)行系統(tǒng)調(diào)用函數(shù)，執(zhí)行系統(tǒng)調(diào)用的時(shí)候，ＣＰＵ的運(yùn)行級(jí)別會(huì)發(fā)生從Ｒｉｎｇ３到Ｒｉｎｇ０的切換，并跳轉(zhuǎn)到系統(tǒng)調(diào)用對(duì)應(yīng)的內(nèi)核代碼位置執(zhí)行，這樣內(nèi)核就為你完成了設(shè)備訪問(wèn)，完成之后再?gòu)模遥椋睿纾胺祷兀遥椋睿纾场＿@個(gè)過(guò)程也稱作用戶態(tài)和內(nèi)核態(tài)的切換。

用戶態(tài)想要使用計(jì)算機(jī)設(shè)備或ＩＯ需通過(guò)系統(tǒng)調(diào)用完成ｓｙｓ　ｃａｌｌ，系統(tǒng)調(diào)用就是讓內(nèi)核來(lái)做這些操作。而系統(tǒng)調(diào)用是影響整個(gè)當(dāng)前進(jìn)程上下文的，ＣＰＵ提供了個(gè)軟中斷來(lái)是實(shí)現(xiàn)保護(hù)線程，獲取系統(tǒng)調(diào)用號(hào)跟參數(shù)，交給內(nèi)核對(duì)應(yīng)系統(tǒng)調(diào)用函數(shù)執(zhí)行。

Ｌｉｎｕｘ系統(tǒng)結(jié)構(gòu)

可以看到每個(gè)應(yīng)用程序都各自有獨(dú)立的虛擬內(nèi)存地址，但每個(gè)虛擬內(nèi)存中對(duì)應(yīng)的內(nèi)核地址其實(shí)是相同的一大塊，這樣當(dāng)進(jìn)程切換到內(nèi)核態(tài)后可以很方便地訪問(wèn)內(nèi)核空間內(nèi)存。比如Ｊａｖａ代碼創(chuàng)建線程ｎｅｗ　Ｔｈｒｅａｄ調(diào)用ｓｔａｒｔ方法后跟蹤ＪＶＭ源碼你會(huì)發(fā)現(xiàn)是調(diào)用ｐｔｈｒｅａｄ＿ｃｒｅａｔｅ來(lái)創(chuàng)建線程的，這就涉及到了用戶態(tài)到內(nèi)核態(tài)的切換。

３　進(jìn)程管理

３．１　進(jìn)程基礎(chǔ)知識(shí)

進(jìn)程是程序的一次執(zhí)行，是一個(gè)程序及其數(shù)據(jù)在機(jī)器上順序執(zhí)行時(shí)所發(fā)生的活動(dòng)，是具有獨(dú)立功能的程序在一個(gè)數(shù)據(jù)集合上的一次運(yùn)行過(guò)程，是系統(tǒng)進(jìn)行資源分配和調(diào)度的一個(gè)基本單位。進(jìn)程的調(diào)度狀態(tài)如下：

狀態(tài)變化圖

重點(diǎn)說(shuō)下掛起跟阻塞：

阻塞一般是當(dāng)系統(tǒng)執(zhí)行ＩＯ操作時(shí)，此時(shí)進(jìn)程進(jìn)入阻塞狀態(tài)，等待某個(gè)事件的返回。

掛起是指進(jìn)程沒(méi)有占有物理內(nèi)存，被寫到磁盤上了。這時(shí)進(jìn)程狀態(tài)是掛起狀態(tài)。

阻塞掛起：進(jìn)程被寫入硬盤并等待某個(gè)事件的出現(xiàn)。

就緒掛起：進(jìn)程被寫入硬盤，進(jìn)入內(nèi)存可直接進(jìn)入就緒狀態(tài)。

３．２　ＰＣＢ

為了描述跟控制進(jìn)程的運(yùn)行，系統(tǒng)為每個(gè)進(jìn)程定義了一個(gè)數(shù)據(jù)結(jié)構(gòu)——進(jìn)程控制塊　Ｐｒｏｃｅｓｓ　Ｃｏｎｔｒｏｌ　Ｂｌｏｃｋ，它是進(jìn)程實(shí)體的一部分，是操作系統(tǒng)中最重要的記錄型數(shù)據(jù)結(jié)構(gòu)。

ＰＣＢ　的作用是使一個(gè)在多道程序環(huán)境下不能獨(dú)立運(yùn)行的程序，成為一個(gè)能獨(dú)立運(yùn)行的基本單位，一個(gè)能與其它進(jìn)程并發(fā)執(zhí)行的進(jìn)程　：

作為獨(dú)立運(yùn)行基本單位的標(biāo)志

實(shí)現(xiàn)間斷性的運(yùn)行方式

提供進(jìn)程管理所需要的信息

提供進(jìn)程調(diào)度所需要的信息

實(shí)現(xiàn)與其他進(jìn)程的同步與通信

３．２．１　ＰＣＢ　信息

ＰＣＢ為實(shí)現(xiàn)上述功能，內(nèi)部包含眾多信息：

進(jìn)程標(biāo)識(shí)符：用于唯一地標(biāo)識(shí)一個(gè)進(jìn)程，一個(gè)進(jìn)程通常有兩種標(biāo)識(shí)符：

內(nèi)部進(jìn)程標(biāo)識(shí)符：標(biāo)識(shí)各個(gè)進(jìn)程，每個(gè)進(jìn)程都有一個(gè)并且唯一的標(biāo)識(shí)符，設(shè)置內(nèi)部標(biāo)識(shí)符主要是為了方便系統(tǒng)使用。

外部進(jìn)程標(biāo)識(shí)符：它由創(chuàng)建者提供，可設(shè)置用戶標(biāo)識(shí)，以指示擁有該進(jìn)程的用戶。往往是由用戶進(jìn)程在訪問(wèn)該進(jìn)程時(shí)使用。一般為了描述進(jìn)程的家族關(guān)系，還應(yīng)設(shè)置父進(jìn)程標(biāo)識(shí)及子進(jìn)程標(biāo)識(shí)。

處理機(jī)狀態(tài)：由各種寄存器組成。包含許多信息都放在寄存器中，方便程序ｒｅｓｔａｒｔ。

通用寄存器、指令計(jì)數(shù)器、程序狀態(tài)字ＰＳＷ、用戶棧指針等信息。

進(jìn)程調(diào)度信息

進(jìn)程狀態(tài)：指明進(jìn)程的當(dāng)前狀態(tài)，作為進(jìn)程調(diào)度和對(duì)換時(shí)的依據(jù)。

進(jìn)程優(yōu)先級(jí)：用于描述進(jìn)程使用處理機(jī)的優(yōu)先級(jí)別的一個(gè)整數(shù)，優(yōu)先級(jí)高的進(jìn)程應(yīng)優(yōu)先獲得處理機(jī)

進(jìn)程調(diào)度所需的其它信息：與所采用的進(jìn)程調(diào)度算法有關(guān)，如進(jìn)程已等待ＣＰＵ的時(shí)間總和、進(jìn)程已執(zhí)行的時(shí)間總和等。

事件：指進(jìn)程由執(zhí)行狀態(tài)轉(zhuǎn)變?yōu)樽枞麪顟B(tài)所等待發(fā)生的事件，即阻塞原因。

資源清單

有關(guān)內(nèi)存地址空間或虛擬地址空間的信息，所打開(kāi)文件的列表和所使用的　Ｉ／Ｏ　設(shè)備信息。

３．２．２　ＰＣＢ　組織方式

操作系統(tǒng)中有太多　ＰＣＢ，如何管理是個(gè)問(wèn)題，一般有如下方式。

線下數(shù)組

線性方式：

將系統(tǒng)所有ＰＣＢ都組織在一張線性表中，將該表首地址存在內(nèi)存的一個(gè)專用區(qū)域

實(shí)現(xiàn)簡(jiǎn)單，開(kāi)銷小，但是每次都需要掃描整張表，適合進(jìn)程數(shù)目不多的系統(tǒng)

索引方式

索引方式：

將同一狀態(tài)的進(jìn)程組織在一個(gè)索引表中，索引表項(xiàng)指向相應(yīng)的　ＰＣＢ，不同狀態(tài)對(duì)應(yīng)不同的索引表。

鏈表方式

鏈接方式：

把同一狀態(tài)的ＰＣＢ鏈接成一個(gè)隊(duì)列，形成就緒隊(duì)列、阻塞隊(duì)列、空白隊(duì)列等。對(duì)其中的就緒隊(duì)列常按進(jìn)程優(yōu)先級(jí)的高低排列，優(yōu)先級(jí)高排在隊(duì)前。

因?yàn)檫M(jìn)程創(chuàng)建、銷毀、調(diào)度頻繁，所以一般采用此模式。

３．３　進(jìn)程控制

進(jìn)程控制是進(jìn)程管理最基本的功能，主要包括創(chuàng)建新進(jìn)程，終止已完成的進(jìn)程，將發(fā)生異常的進(jìn)程置于阻塞狀態(tài)，將進(jìn)程喚醒等。

３．３．１　進(jìn)程創(chuàng)建

父進(jìn)程可創(chuàng)建子進(jìn)程，父進(jìn)程終止后子進(jìn)程也會(huì)被終止。子進(jìn)程可繼承父進(jìn)程所有資源，子進(jìn)程終止需將自己所繼承的資源歸還父進(jìn)程。接下來(lái)看下創(chuàng)建的大致流程。

為新進(jìn)程分配唯一進(jìn)件標(biāo)識(shí)號(hào)，然后創(chuàng)建一個(gè)空白ＰＣＢ，需注意ＰＣＢ數(shù)量是有限的，所以可能會(huì)創(chuàng)建失敗。

嘗試為新進(jìn)程分配所需資源，如果資源不足進(jìn)程會(huì)進(jìn)入等待狀態(tài)。

初始化ＰＣＢ，有如下幾個(gè)操作。

標(biāo)識(shí)信息：將系統(tǒng)分配的標(biāo)識(shí)符和父進(jìn)程標(biāo)識(shí)符填入新ＰＣＢ

處理機(jī)狀態(tài)信息：使程序計(jì)數(shù)器指向程序入口地址，使棧指針指向棧頂

處理機(jī)控制信息：將進(jìn)程設(shè)為就緒／靜止?fàn)顟B(tài)，通常設(shè)為最低優(yōu)先級(jí)

如果進(jìn)程調(diào)度隊(duì)列能接納新進(jìn)程，就將進(jìn)程插入到就緒隊(duì)列，等待被調(diào)度運(yùn)行。

３．３．２　進(jìn)程終止

進(jìn)程終止情況一般分為正常結(jié)束、異常結(jié)束、外界干預(yù)三種。

正常結(jié)束

異常結(jié)束

越界錯(cuò)：訪問(wèn)的存儲(chǔ)區(qū)越出該進(jìn)程的區(qū)域

保護(hù)錯(cuò)：試圖訪問(wèn)不允許訪問(wèn)的資源，或以不適當(dāng)?shù)姆绞皆L問(wèn)（寫只讀）

非法指令：試圖執(zhí)行不存在的指令（可能是程序錯(cuò)誤地轉(zhuǎn)移到數(shù)據(jù)區(qū)，數(shù)據(jù)當(dāng)成了指令）

特權(quán)指令出錯(cuò)：用戶進(jìn)程試圖執(zhí)行一條只允許ＯＳ執(zhí)行的指令

運(yùn)行超時(shí)：執(zhí)行時(shí)間超過(guò)指定的最大值

等待超時(shí)：進(jìn)程等待某件事超過(guò)指定的最大值

算數(shù)運(yùn)算錯(cuò)：試圖執(zhí)行被禁止的運(yùn)算（被０除）

Ｉ／Ｏ故障

外界干預(yù)

操作員或ＯＳ干預(yù)（死鎖）

父進(jìn)程請(qǐng)求，子進(jìn)程完成父進(jìn)程指定的任務(wù)時(shí)

父進(jìn)程終止，所有子進(jìn)程都應(yīng)該結(jié)束

終止過(guò)程：

根據(jù)被終止進(jìn)程的標(biāo)識(shí)符，從ＰＣＢ集合中檢索出該ＰＣＢ，讀取進(jìn)程狀態(tài)

若處于執(zhí)行狀態(tài)則立即終止執(zhí)行，將ＣＰＵ資源分配給其他進(jìn)程。

若進(jìn)程有子孫進(jìn)程則將其所有子孫進(jìn)程終止。

全部資源還給父進(jìn)程或操作系統(tǒng)。

該進(jìn)程的ＰＣＢ從所在隊(duì)列／鏈表中移出。

３．３．３　進(jìn)程阻塞

意思是該進(jìn)程執(zhí)行半路被阻塞，必須由某個(gè)事件進(jìn)程喚醒該進(jìn)程。常見(jiàn)的就是ＩＯ讀取操作。常見(jiàn)阻塞時(shí)機(jī)／事件如下：

請(qǐng)求共享資源失敗，系統(tǒng)無(wú)足夠資源分配

等待某種操作完成

新數(shù)據(jù)尚未到達(dá)（相互合作的進(jìn)程）

等待新任務(wù)

阻塞流程：

找到要被阻塞進(jìn)程標(biāo)識(shí)號(hào)對(duì)應(yīng)的　ＰＣＢ。

將該進(jìn)程由運(yùn)行狀態(tài)轉(zhuǎn)換為阻塞狀態(tài)。

將該　進(jìn)程ＰＣＢ　插入的阻塞隊(duì)列中去。

３．３．４　進(jìn)程喚醒

喚醒　原語(yǔ)　ｗａｋｅ　ｕｐ，一般和阻塞成對(duì)使用。喚醒過(guò)程如下：

從阻塞隊(duì)列找到所需ＰＣＢ。

ＰＣＢ從阻塞隊(duì)列溢出，然后變?yōu)榫途w狀態(tài)。

從阻塞隊(duì)列溢出該ＰＣＢ然后插入到就緒狀態(tài)隊(duì)列等待被分配ＣＰＵ資源。

３．４　進(jìn)程調(diào)度

進(jìn)程數(shù)一般會(huì)大于ＣＰＵ個(gè)數(shù)，進(jìn)程狀態(tài)切換主要由調(diào)度程序進(jìn)行調(diào)度。一般情況下ＣＰＵ調(diào)度時(shí)主要分為搶占式調(diào)度跟非搶占式調(diào)度。

非搶占式：讓進(jìn)程運(yùn)行直到結(jié)束或阻塞的調(diào)度方式，　容易實(shí)現(xiàn)，適合專用系統(tǒng)。

搶占式：每個(gè)進(jìn)程獲得時(shí)間片才可以被ＣＰＵ調(diào)度運(yùn)行，　可防止單一進(jìn)程長(zhǎng)時(shí)間獨(dú)占ＣＰＵ　系統(tǒng)開(kāi)銷大。

３．４．１　進(jìn)程調(diào)度原則

ＣＰＵ　利用率

ＣＰＵ利用率　＝　忙碌時(shí)間　／　總時(shí)間。

調(diào)度程序應(yīng)該盡量讓　ＣＰＵ　始終處于忙碌的狀態(tài)，這可提高　ＣＰＵ　的利用率。比如當(dāng)發(fā)生ＩＯ讀取時(shí)候，不要傻傻等待，去執(zhí)行下別的進(jìn)程。

系統(tǒng)吞吐量

系統(tǒng)吞吐量　＝　總共完成多少個(gè)作業(yè)　／　總共花費(fèi)時(shí)間。

長(zhǎng)作業(yè)的進(jìn)程會(huì)占用較長(zhǎng)的　ＣＰＵ　資源導(dǎo)致降低吞吐量，相反短作業(yè)的進(jìn)程會(huì)提升系統(tǒng)吞吐量。

周轉(zhuǎn)時(shí)間

周轉(zhuǎn)時(shí)間　＝　作業(yè)完成時(shí)間　－　作業(yè)提交時(shí)間。

平均周轉(zhuǎn)時(shí)間　＝　各作業(yè)周轉(zhuǎn)時(shí)間和　／　作業(yè)數(shù)

帶權(quán)周轉(zhuǎn)時(shí)間　＝　作業(yè)周轉(zhuǎn)時(shí)間　／　作業(yè)實(shí)際運(yùn)行時(shí)間

平均帶權(quán)周轉(zhuǎn)時(shí)間　＝　各作業(yè)帶權(quán)周轉(zhuǎn)時(shí)間之和　／　作業(yè)數(shù)

盡可能使周轉(zhuǎn)時(shí)間降低。

等待時(shí)間

指的是進(jìn)程在等待隊(duì)列中等待的時(shí)間，一般也需要盡可能短。

響應(yīng)時(shí)間

響應(yīng)時(shí)間　＝　系統(tǒng)第一次響應(yīng)時(shí)間　－　用戶提交時(shí)間，在交互式系統(tǒng)中響應(yīng)時(shí)間是衡量調(diào)度算法好壞的主要標(biāo)準(zhǔn)。

３．４．２　調(diào)度算法

ＦＣＦＳ　算法

Ｆｉｒｓｔ　Ｃｏｍｅ　Ｆｉｒｓｔ　Ｓｅｖｅｒｄ　先來(lái)先服務(wù)算法，遵循先來(lái)后端原則，每次從就緒隊(duì)列拿等待時(shí)間最久的，運(yùn)行完畢后再拿下一個(gè)。

該模式對(duì)長(zhǎng)作業(yè)有利，適用　ＣＰＵ　繁忙型作業(yè)的系統(tǒng)，不適用　Ｉ／Ｏ　型作業(yè)，因?yàn)闀?huì)導(dǎo)致進(jìn)程ＣＰＵ利用率很低。

ＳＪＦ　算法

Ｓｈｏｒｔｅｓｔ　Ｊｏｂ　Ｆｉｒｓｔ　最短作業(yè)優(yōu)先算法，該算法會(huì)優(yōu)先選擇運(yùn)行所需時(shí)間最短的進(jìn)程執(zhí)行，可提高吞吐量。

跟ＦＣＦＳ正好相反，對(duì)長(zhǎng)作業(yè)很不利。

ＳＲＴＮ　算法

Ｓｈｏｒｔｅｓｔ　Ｒｅｍａｉｎｉｎｇ　Ｔｉｍｅ　Ｎｅｘｔ　最短剩余時(shí)間優(yōu)先算法，可以認(rèn)為是ＳＪＦ的搶占式版本，當(dāng)一個(gè)新就緒的進(jìn)程比當(dāng)前運(yùn)行進(jìn)程具有更短完成時(shí)間時(shí)，系統(tǒng)搶占當(dāng)前進(jìn)程，選擇新就緒的進(jìn)程執(zhí)行。

有最短的平均周轉(zhuǎn)時(shí)間，但不公平，源源不斷的短任務(wù)到來(lái)，可能使長(zhǎng)的任務(wù)長(zhǎng)時(shí)間得不到運(yùn)行。

ＨＲＲＮ　算法

Ｈｉｇｈｅｓｔ　Ｒｅｓｐｏｎｓｅ　Ｒａｔｉｏ　Ｎｅｘｔ　最高響應(yīng)比優(yōu)先算法，為了平衡前面?zhèn)z而生，按照響應(yīng)優(yōu)先權(quán)從高到低依次執(zhí)行。屬于前面?zhèn)z的折中權(quán)衡。

優(yōu)先權(quán)　＝　（等待時(shí)間　＋　要求服務(wù)時(shí)間）　／　要求服務(wù)時(shí)間

ＲＲ　算法

Ｒｏｕｎｄ　Ｒｏｂｉｎ　時(shí)間片輪轉(zhuǎn)算法，操作系統(tǒng)設(shè)定了個(gè)時(shí)間片Ｑｕａｎｔｕｍ，時(shí)間片導(dǎo)致每個(gè)進(jìn)程只有在該時(shí)間片內(nèi)才可以運(yùn)行，這種方式導(dǎo)致每個(gè)進(jìn)程都會(huì)均勻的獲得執(zhí)行權(quán)。

時(shí)間片一般２０ｍｓ～５０ｍｓ，如果太小會(huì)導(dǎo)致系統(tǒng)頻繁進(jìn)行上下文切換，太大又可能引起對(duì)短的交互請(qǐng)求的響應(yīng)變差。

ＨＰＦ　算法

Ｈｉｇｈｅｓｔ　Ｐｒｉｏｒｉｔｙ　Ｆｉｒｓｔ　最高優(yōu)先級(jí)調(diào)度算法，從就緒隊(duì)列中選擇最高優(yōu)先級(jí)的進(jìn)程先執(zhí)行。

優(yōu)先級(jí)的設(shè)置有初始化固定死的那種，也有在代碼運(yùn)轉(zhuǎn)過(guò)程中根據(jù)等待時(shí)間或性能動(dòng)態(tài)調(diào)整　這兩種思路。

缺點(diǎn)是可能導(dǎo)致低優(yōu)先級(jí)的一直無(wú)法被執(zhí)行。

ＭＦＱ　算法

Ｍｕｌｔｉｌｅｖｅｌ　Ｆｅｅｄｂａｃｋ　Ｑｕｅｕｅ　多級(jí)反饋隊(duì)列調(diào)度算法　，可以認(rèn)為是　ＲＲ　算法　跟　ＨＰＦ　算法　的綜合體。

系統(tǒng)會(huì)同時(shí)存在多個(gè)就緒隊(duì)列，每個(gè)隊(duì)列優(yōu)先級(jí)從高到低排列，同時(shí)優(yōu)先級(jí)越高獲得是時(shí)間片越短。

新進(jìn)程會(huì)先加入到最高優(yōu)先級(jí)隊(duì)列，如果新進(jìn)程優(yōu)先級(jí)高于當(dāng)前在執(zhí)行的進(jìn)程，會(huì)停止當(dāng)前進(jìn)程轉(zhuǎn)而去執(zhí)行新進(jìn)程。新進(jìn)程如果在時(shí)間片內(nèi)沒(méi)執(zhí)行完畢需下移到次優(yōu)先級(jí)隊(duì)列。

多級(jí)反饋隊(duì)列調(diào)度算法

３．５　線程

３．５．１　線程定義

早期操作系統(tǒng)是沒(méi)有線程概念的，線程是后來(lái)加進(jìn)來(lái)的。為啥會(huì)有線程呢？那是因?yàn)橐郧霸诙噙M(jìn)程階段，經(jīng)常會(huì)涉及到進(jìn)程之間如何通訊，如何共享數(shù)據(jù)的問(wèn)題。并且進(jìn)程關(guān)聯(lián)到ＰＣＢ的生命周期，管理起來(lái)開(kāi)銷較大。為了解決這個(gè)問(wèn)題引入了線程。

線程是進(jìn)程當(dāng)中的一個(gè)執(zhí)行流程。同一個(gè)進(jìn)程內(nèi)的多個(gè)線程之間可以共享進(jìn)程的代碼段、數(shù)據(jù)段、打開(kāi)的文件等資源。同時(shí)每個(gè)線程又都有一套獨(dú)立的寄存器和棧來(lái)確保線程的控制流是獨(dú)立的。

進(jìn)程有個(gè)ＰＣＢ來(lái)管理，同理操作系統(tǒng)通過(guò)　Ｔｈｒｅａｄ　Ｃｏｎｔｒｏｌ　Ｂｌｏｃｋ線程控制塊來(lái)實(shí)現(xiàn)線程的管控。

３．５．２　線程優(yōu)缺點(diǎn)

優(yōu)點(diǎn)

一個(gè)進(jìn)程中可以同時(shí)存在１～Ｎ個(gè)線程，這些線程可以并發(fā)的執(zhí)行。

各個(gè)線程之間可以共享地址空間和文件等資源。

缺點(diǎn)

當(dāng)進(jìn)程中的一個(gè)線程奔潰時(shí)，會(huì)導(dǎo)致其所屬進(jìn)程的所有線程奔潰。

多線程編程，讓人頭大的東西。

線程執(zhí)行開(kāi)銷小，但不利于資源的隔離管理和保護(hù)，而進(jìn)程正相反。

３．５．３　進(jìn)程跟線程關(guān)聯(lián)

進(jìn)程：

是系統(tǒng)進(jìn)行資源分配和調(diào)度的一個(gè)獨(dú)立單位．

是程序的一次執(zhí)行，每個(gè)進(jìn)程都有自己的地址空間、內(nèi)存、數(shù)據(jù)棧及其他輔助記錄運(yùn)行軌跡的數(shù)據(jù)

線程：

是進(jìn)程的一個(gè)實(shí)體，是ＣＰＵ調(diào)度和分派的基本單位，它是比進(jìn)程更小的能獨(dú)立運(yùn)行的基本單位

所有的線程運(yùn)行在同一個(gè)進(jìn)程中，共享相同的運(yùn)行資源和環(huán)境

線程一般是并發(fā)執(zhí)行的，使得實(shí)現(xiàn)了多任務(wù)的并行和數(shù)據(jù)共享。

進(jìn)程線程區(qū)別：

一個(gè)線程只能屬于一個(gè)進(jìn)程，而一個(gè)進(jìn)程可以有多個(gè)線程，但至少有一個(gè)線程。

線程的劃分尺度小于進(jìn)程（資源比進(jìn)程少），使得多線程程序的并發(fā)性高。

進(jìn)程在執(zhí)行過(guò)程中擁有獨(dú)立的內(nèi)存單元，而多個(gè)線程共享內(nèi)存，從而極大地提高了程序的運(yùn)行效率。

資源分配給進(jìn)程，同一進(jìn)程的所有線程共享該進(jìn)程的所有資源。

ＣＰＵ分配資源給進(jìn)程，但真正在ＣＰＵ上運(yùn)行的是線程。

線程不能夠獨(dú)立執(zhí)行，必須依存在進(jìn)程中。

線程快在哪兒？

線程創(chuàng)建的時(shí)有些資源不需要自己管理，直接從進(jìn)程拿即可，線程管理寄存器跟棧的生命周期即可。

同進(jìn)程內(nèi)多線程共享數(shù)據(jù)，所以進(jìn)程數(shù)據(jù)傳輸可以用ｚｅｒｏ　ｃｏｐｙ技術(shù)，不需要經(jīng)過(guò)內(nèi)核了。

進(jìn)程使用一個(gè)虛擬內(nèi)存跟頁(yè)表，然后多線程共用這些虛擬內(nèi)存，如果同進(jìn)程內(nèi)兩個(gè)線程進(jìn)行上下文切換比進(jìn)程提速很多。

３．５．４　線程實(shí)現(xiàn)

在前面的內(nèi)存管理中說(shuō)到了內(nèi)核態(tài)跟用戶態(tài)。相對(duì)應(yīng)的線程的創(chuàng)建也分為用戶態(tài)線程跟內(nèi)核態(tài)線程。

３．５．４．１　用戶態(tài)線程

在用戶空間實(shí)現(xiàn)的線程，由用戶態(tài)的線程庫(kù)來(lái)完成線程的管理。操作系統(tǒng)按進(jìn)程維度進(jìn)行調(diào)度，當(dāng)線程在用戶態(tài)創(chuàng)建時(shí)應(yīng)用程序在用戶空間內(nèi)要實(shí)現(xiàn)線程的創(chuàng)建、維護(hù)和調(diào)度。操作系統(tǒng)對(duì)線程的存在一無(wú)所知！操作系統(tǒng)只能看到進(jìn)程看不到線程。所有的線程都是在用戶空間實(shí)現(xiàn)。在操作系統(tǒng)看來(lái)，每一個(gè)進(jìn)程只有一個(gè)線程。

初中高中九科名師視頻課程免費(fèi)試聽(tīng)1200分鐘

熱門課程