java volatile
java volatile在java 5之前,是一個(gè)備受爭議的關(guān)鍵字,因?yàn)樵诔绦蛑惺褂盟鶗?huì)導(dǎo)致出人意料的結(jié)果。在java 5之后,volatile關(guān)鍵字才得以重獲生機(jī)。
java volatile 關(guān)鍵字是與java的內(nèi)存模型有關(guān)的,因此在講述volatile關(guān)鍵之前,我們先來了解一下與內(nèi)存模型相關(guān)的概念和知識(shí),然后分析了volatile關(guān)鍵字的實(shí)現(xiàn)原理,最后給出了幾個(gè)使用volatile關(guān)鍵字的場景。
一. 內(nèi)存模型的相關(guān)概念
大家都知道,計(jì)算機(jī)在執(zhí)行程序時(shí),每條指令都是在cpu中執(zhí)行的,而執(zhí)行指令過程中,勢必涉及到數(shù)據(jù)的讀取和寫入。由于程序運(yùn)行過程中的臨時(shí)數(shù)據(jù)是存放在主存(物理內(nèi)存)當(dāng)中的,這時(shí)就存在一個(gè)問題,由于cpu執(zhí)行速度很快,而從內(nèi)存讀取數(shù)據(jù)和向內(nèi)存寫入數(shù)據(jù)的過程跟cpu執(zhí)行指令的速度比起來要慢的多,因此如果任何時(shí)候?qū)?shù)據(jù)的操作都要通過和內(nèi)存的交互來進(jìn)行,會(huì)大大降低指令執(zhí)行的速度。因此在cpu里面就有了高速緩存。
也就是,當(dāng)程序在運(yùn)行過程中,會(huì)將運(yùn)算需要的數(shù)據(jù)從主存復(fù)制一份到cpu的高速緩存當(dāng)中,那么cpu進(jìn)行計(jì)算時(shí)就可以直接從它的高速緩存讀取數(shù)據(jù)和向其中寫入數(shù)據(jù),當(dāng)運(yùn)算結(jié)束之后,再將高速緩存中的數(shù)據(jù)刷新到主存當(dāng)中。舉個(gè)簡單的例子,比如下面的這段代碼:
i = i + 1;
當(dāng)線程執(zhí)行這個(gè)語句時(shí),會(huì)先從主存當(dāng)中讀取i的值,然后復(fù)制一份到高速緩存當(dāng)中,然后cpu執(zhí)行指令對i進(jìn)行加1操作,然后將數(shù)據(jù)寫入高速緩存,最后將高速緩存中i最新的值刷新到主存當(dāng)中。
這個(gè)代碼在單線程中運(yùn)行是沒有任何問題的,但是在多線程中運(yùn)行就會(huì)有問題了。在多核cpu中,每條線程可能運(yùn)行于不同的cpu中,因此每個(gè)線程運(yùn)行時(shí)有自己的高速緩存(對單核cpu來說,其實(shí)也會(huì)出現(xiàn)這種問題,只不過是以線程調(diào)度的形式來分別執(zhí)行的)。本文我們以多核cpu為例。
比如同時(shí)有2個(gè)線程執(zhí)行這段代碼,假如初始時(shí)i的值為0,那么我們希望兩個(gè)線程執(zhí)行完之后i的值變?yōu)?。但是事實(shí)會(huì)是這樣嗎?可能存在下面一種情況:初始時(shí),兩個(gè)線程分別讀取i的值存入各自所在的cpu的高速緩存當(dāng)中,然后線程1進(jìn)行加1操作,然后把i的最新值1寫入到內(nèi)存。此時(shí)線程2的高速緩存當(dāng)中i的值還是0,進(jìn)行加1操作之后,i的值為1,然后線程2把i的值寫入內(nèi)存。
最終結(jié)果i的值是1,而不是2。這就是著名的緩存一致性問題。通常稱這種被多個(gè)線程訪問的變量為共享變量。也就是說,如果一個(gè)變量在多個(gè)cpu中都存在緩存(一般在多線程編程時(shí)才會(huì)出現(xiàn)),那么就可能存在緩存不一致的問題。
為了解決緩存不一致性問題,通常來說有以下2種解決方法:
- 1)通過在總線加lock#鎖的方式
- 2)通過緩存一致性協(xié)議
這2種方式都是硬件層面上提供的方式。
在早期的cpu當(dāng)中,是通過在總線上加lock#鎖的形式來解決緩存不一致的問題。因?yàn)閏pu和其他部件進(jìn)行通信都是通過總線來進(jìn)行的,如果對總線加lock#鎖的話,也就是說阻塞了其他cpu對其他部件訪問(如內(nèi)存),從而使得只能有一個(gè)cpu能使用這個(gè)變量的內(nèi)存。比如上面例子中 如果一個(gè)線程在執(zhí)行 i = i +1,如果在執(zhí)行這段代碼的過程中,在總線上發(fā)出了lcok#鎖的信號(hào),那么只有等待這段代碼完全執(zhí)行完畢之后,其他cpu才能從變量i所在的內(nèi)存讀取變量,然后進(jìn)行相應(yīng)的操作。這樣就解決了緩存不一致的問題。
但是上面的方式會(huì)有一個(gè)問題,由于在鎖住總線期間,其他cpu無法訪問內(nèi)存,導(dǎo)致效率低下。所以就出現(xiàn)了緩存一致性協(xié)議。最出名的就是intel 的mesi協(xié)議,mesi協(xié)議保證了每個(gè)緩存中使用的共享變量的副本是一致的。它核心的思想是:當(dāng)cpu寫數(shù)據(jù)時(shí),如果發(fā)現(xiàn)操作的變量是共享變量,即在其他cpu中也存在該變量的副本,會(huì)發(fā)出信號(hào)通知其他cpu將該變量的緩存行置為無效狀態(tài),因此當(dāng)其他cpu需要讀取這個(gè)變量時(shí),發(fā)現(xiàn)自己緩存中緩存該變量的緩存行是無效的,那么它就會(huì)從內(nèi)存重新讀取。
二. 并發(fā)編程中的三個(gè)概念
在并發(fā)編程中,我們通常會(huì)遇到以下三個(gè)問題:原子性問題,可見性問題,有序性問題。我們先看具體看一下這三個(gè)概念:
1.原子性
原子性:即一個(gè)操作或者多個(gè)操作 要么全部執(zhí)行并且執(zhí)行的過程不會(huì)被任何因素打斷,要么就都不執(zhí)行。
一個(gè)很經(jīng)典的例子就是銀行賬戶轉(zhuǎn)賬問題:比如從賬戶a向賬戶b轉(zhuǎn)1000元,那么必然包括2個(gè)操作:從賬戶a減去1000元,往賬戶b加上1000元。
試想一下,如果這2個(gè)操作不具備原子性,會(huì)造成什么樣的后果。假如從賬戶a減去1000元之后,操作突然中止。然后又從b取出了500元,取出500元之后,再執(zhí)行 往賬戶b加上1000元 的操作。這樣就會(huì)導(dǎo)致賬戶a雖然減去了1000元,但是賬戶b沒有收到這個(gè)轉(zhuǎn)過來的1000元。所以這2個(gè)操作必須要具備原子性才能保證不出現(xiàn)一些意外的問題。
同樣地反映到并發(fā)編程中會(huì)出現(xiàn)什么結(jié)果呢?
舉個(gè)最簡單的例子,大家想一下假如為一個(gè)32位的變量賦值過程不具備原子性的話,會(huì)發(fā)生什么后果?
i = 9;
假若一個(gè)線程執(zhí)行到這個(gè)語句時(shí),我暫且假設(shè)為一個(gè)32位的變量賦值包括兩個(gè)過程:為低16位賦值,為高16位賦值。那么就可能發(fā)生一種情況:當(dāng)將低16位數(shù)值寫入之后,突然被中斷,而此時(shí)又有一個(gè)線程去讀取i的值,那么讀取到的就是錯(cuò)誤的數(shù)據(jù)。
2.可見性
可見性是指當(dāng)多個(gè)線程訪問同一個(gè)變量時(shí),一個(gè)線程修改了這個(gè)變量的值,其他線程能夠立即看得到修改的值。舉個(gè)簡單的例子,看下面這段代碼:
//線程1執(zhí)行的代碼 int i = 0; i = 10; //線程2執(zhí)行的代碼 j = i;
假若執(zhí)行線程1的是cpu1,執(zhí)行線程2的是cpu2。由上面的分析可知,當(dāng)線程1執(zhí)行 i =10這句時(shí),會(huì)先把i的初始值加載到cpu1的高速緩存中,然后賦值為10,那么在cpu1的高速緩存當(dāng)中i的值變?yōu)?0了,卻沒有立即寫入到主存當(dāng)中。
此時(shí)線程2執(zhí)行 j = i,它會(huì)先去主存讀取i的值并加載到cpu2的緩存當(dāng)中,注意此時(shí)內(nèi)存當(dāng)中i的值還是0,那么就會(huì)使得j的值為0,而不是10。這就是可見性問題,線程1對變量i修改了之后,線程2沒有立即看到線程1修改的值。
3.有序性
有序性:即程序執(zhí)行的順序按照代碼的先后順序執(zhí)行。舉個(gè)簡單的例子,看下面這段代碼:
int i = 0; boolean flag = false; i = 1; //語句1 flag = true; //語句2
上面代碼定義了一個(gè)int型變量,定義了一個(gè)boolean類型變量,然后分別對兩個(gè)變量進(jìn)行賦值操作。從代碼順序上看,語句1是在語句2前面的,那么jvm在真正執(zhí)行這段代碼的時(shí)候會(huì)保證語句1一定會(huì)在語句2前面執(zhí)行嗎?不一定,為什么呢?這里可能會(huì)發(fā)生指令重排序(instruction reorder)。
下面解釋一下什么是指令重排序,一般來說,處理器為了提高程序運(yùn)行效率,可能會(huì)對輸入代碼進(jìn)行優(yōu)化,它不保證程序中各個(gè)語句的執(zhí)行先后順序同代碼中的順序一致,但是它會(huì)保證程序最終執(zhí)行結(jié)果和代碼順序執(zhí)行的結(jié)果是一致的。比如上面的代碼中,語句1和語句2誰先執(zhí)行對最終的程序結(jié)果并沒有影響,那么就有可能在執(zhí)行過程中,語句2先執(zhí)行而語句1后執(zhí)行。
但是要注意,雖然處理器會(huì)對指令進(jìn)行重排序,但是它會(huì)保證程序最終結(jié)果會(huì)和代碼順序執(zhí)行結(jié)果相同,那么它靠什么保證的呢?再看下面一個(gè)例子:
int a = 10; //語句1 int r = 2; //語句2 a = a + 3; //語句3 r = a*a; //語句4
這段代碼有4個(gè)語句,那么可能的一個(gè)執(zhí)行順序是:
那么可不可能是這個(gè)執(zhí)行順序呢: 語句2 語句1 語句4 語句3
不可能,因?yàn)樘幚砥髟谶M(jìn)行重排序時(shí)是會(huì)考慮指令之間的數(shù)據(jù)依賴性,如果一個(gè)指令instruction 2必須用到instruction 1的結(jié)果,那么處理器會(huì)保證instruction 1會(huì)在instruction 2之前執(zhí)行。
雖然重排序不會(huì)影響單個(gè)線程內(nèi)程序執(zhí)行的結(jié)果,但是多線程呢?下面看一個(gè)例子:
//線程1: context = loadcontext(); //語句1 inited = true; //語句2 //線程2: while(!inited ){ sleep() } dosomethingwithconfig(context);
上面代碼中,由于語句1和語句2沒有數(shù)據(jù)依賴性,因此可能會(huì)被重排序。假如發(fā)生了重排序,在線程1執(zhí)行過程中先執(zhí)行語句2,而此是線程2會(huì)以為初始化工作已經(jīng)完成,那么就會(huì)跳出while循環(huán),去執(zhí)行dosomethingwithconfig(context)方法,而此時(shí)context并沒有被初始化,就會(huì)導(dǎo)致程序出錯(cuò)。
從上面可以看出,指令重排序不會(huì)影響單個(gè)線程的執(zhí)行,但是會(huì)影響到線程并發(fā)執(zhí)行的正確性。也就是說,要想并發(fā)程序正確地執(zhí)行,必須要保證原子性、可見性以及有序性。只要有一個(gè)沒有被保證,就有可能會(huì)導(dǎo)致程序運(yùn)行不正確。
三. java內(nèi)存模型
在前面談到了一些關(guān)于內(nèi)存模型以及并發(fā)編程中可能會(huì)出現(xiàn)的一些問題。下面我們來看一下java內(nèi)存模型,研究一下java內(nèi)存模型為我們提供了哪些保證以及在java中提供了哪些方法和機(jī)制來讓我們在進(jìn)行多線程編程時(shí)能夠保證程序執(zhí)行的正確性。
在java虛擬機(jī)規(guī)范中試圖定義一種java內(nèi)存模型(java memory model,jmm)來屏蔽各個(gè)硬件平臺(tái)和操作系統(tǒng)的內(nèi)存訪問差異,以實(shí)現(xiàn)讓java程序在各種平臺(tái)下都能達(dá)到一致的內(nèi)存訪問效果。那么java內(nèi)存模型規(guī)定了哪些東西呢,它定義了程序中變量的訪問規(guī)則,往大一點(diǎn)說是定義了程序執(zhí)行的次序。注意,為了獲得較好的執(zhí)行性能,java內(nèi)存模型并沒有限制執(zhí)行引擎使用處理器的寄存器或者高速緩存來提升指令執(zhí)行速度,也沒有限制編譯器對指令進(jìn)行重排序。也就是說,在java內(nèi)存模型中,也會(huì)存在緩存一致性問題和指令重排序的問題。
java內(nèi)存模型規(guī)定所有的變量都是存在主存當(dāng)中(類似于前面說的物理內(nèi)存),每個(gè)線程都有自己的工作內(nèi)存(類似于前面的高速緩存)。線程對變量的所有操作都必須在工作內(nèi)存中進(jìn)行,而不能直接對主存進(jìn)行操作。并且每個(gè)線程不能訪問其他線程的工作內(nèi)存。
舉個(gè)簡單的例子:在java中,執(zhí)行下面這個(gè)語句:
i = 10;
執(zhí)行線程必須先在自己的工作線程中對變量i所在的緩存行進(jìn)行賦值操作,然后再寫入主存當(dāng)中。而不是直接將數(shù)值10寫入主存當(dāng)中。
那么java語言 本身對 原子性、可見性以及有序性提供了哪些保證呢?
1.原子性
在java中,對基本數(shù)據(jù)類型的變量的讀取和賦值操作是原子性操作,即這些操作是不可被中斷的,要么執(zhí)行,要么不執(zhí)行。上面一句話雖然看起來簡單,但是理解起來并不是那么容易??聪旅嬉粋€(gè)例子i:
請分析以下哪些操作是原子性操作:
x = 10; //語句1 y = x; //語句2 x++; //語句3 x = x + 1; //語句4
有些朋友可能會(huì)說上面的4個(gè)語句中的操作都是原子性操作。其實(shí)只有語句1是原子性操作,其他三個(gè)語句都不是原子性操作。
語句1是直接將數(shù)值10賦值給x,也就是說線程執(zhí)行這個(gè)語句的會(huì)直接將數(shù)值10寫入到工作內(nèi)存中。
語句2實(shí)際上包含2個(gè)操作,它先要去讀取x的值,再將x的值寫入工作內(nèi)存,雖然讀取x的值以及 將x的值寫入工作內(nèi)存 這2個(gè)操作都是原子性操作,但是合起來就不是原子性操作了。
同樣的,x++和 x = x+1包括3個(gè)操作:讀取x的值,進(jìn)行加1操作,寫入新的值。所以上面4個(gè)語句只有語句1的操作具備原子性。也就是說,只有簡單的讀取、賦值(而且必須是將數(shù)字賦值給某個(gè)變量,變量之間的相互賦值不是原子操作)才是原子操作。
不過這里有一點(diǎn)需要注意:在32位平臺(tái)下,對64位數(shù)據(jù)的讀取和賦值是需要通過兩個(gè)操作來完成的,不能保證其原子性。但是好像在最新的jdk中,jvm已經(jīng)保證對64位數(shù)據(jù)的讀取和賦值也是原子性操作了。
從上面可以看出,java內(nèi)存模型只保證了基本讀取和賦值是原子性操作,如果要實(shí)現(xiàn)更大范圍操作的原子性,可以通過synchronized和lock來實(shí)現(xiàn)。由于synchronized和lock能夠保證任一時(shí)刻只有一個(gè)線程執(zhí)行該代碼塊,那么自然就不存在原子性問題了,從而保證了原子性。
2.可見性
對于可見性,java提供了volatile關(guān)鍵字來保證可見性。當(dāng)一個(gè)共享變量被volatile修飾時(shí),它會(huì)保證修改的值會(huì)立即被更新到主存,當(dāng)有其他線程需要讀取時(shí),它會(huì)去內(nèi)存中讀取新值。
而普通的共享變量不能保證可見性,因?yàn)槠胀ü蚕碜兞勘恍薷闹?,什么時(shí)候被寫入主存是不確定的,當(dāng)其他線程去讀取時(shí),此時(shí)內(nèi)存中可能還是原來的舊值,因此無法保證可見性。
另外,通過synchronized和lock也能夠保證可見性,synchronized和lock能保證同一時(shí)刻只有一個(gè)線程獲取鎖然后執(zhí)行同步代碼,并且在釋放鎖之前會(huì)將對變量的修改刷新到主存當(dāng)中。因此可以保證可見性。
3.有序性
在java內(nèi)存模型中,允許編譯器和處理器對指令進(jìn)行重排序,但是重排序過程不會(huì)影響到單線程程序的執(zhí)行,卻會(huì)影響到多線程并發(fā)執(zhí)行的正確性。
在java里面,可以通過volatile關(guān)鍵字來保證一定的“有序性”(具體原理在下一節(jié)講述)。另外可以通過synchronized和lock來保證有序性,很顯然,synchronized和lock保證每個(gè)時(shí)刻是有一個(gè)線程執(zhí)行同步代碼,相當(dāng)于是讓線程順序執(zhí)行同步代碼,自然就保證了有序性。
另外,java內(nèi)存模型具備一些先天的“有序性”,即不需要通過任何手段就能夠得到保證的有序性,這個(gè)通常也稱為 happens-before 原則。如果兩個(gè)操作的執(zhí)行次序無法從happens-before原則推導(dǎo)出來,那么它們就不能保證它們的有序性,虛擬機(jī)可以隨意地對它們進(jìn)行重排序。
下面就來具體介紹下happens-before原則(先行發(fā)生原則):
- 程序次序規(guī)則:一個(gè)線程內(nèi),按照代碼順序,書寫在前面的操作先行發(fā)生于書寫在后面的操作
- 鎖定規(guī)則:一個(gè)unlock操作先行發(fā)生于后面對同一個(gè)鎖額lock操作
- volatile變量規(guī)則:對一個(gè)變量的寫操作先行發(fā)生于后面對這個(gè)變量的讀操作
- 傳遞規(guī)則:如果操作a先行發(fā)生于操作b,而操作b又先行發(fā)生于操作c,則可以得出操作a先行發(fā)生于操作c
- 線程啟動(dòng)規(guī)則:thread對象的start()方法先行發(fā)生于此線程的每個(gè)一個(gè)動(dòng)作
- 線程中斷規(guī)則:對線程interrupt()方法的調(diào)用先行發(fā)生于被中斷線程的代碼檢測到中斷事件的發(fā)生
- 線程終結(jié)規(guī)則:線程中所有的操作都先行發(fā)生于線程的終止檢測,我們可以通過thread.join()方法結(jié)束、thread.isalive()的返回值手段檢測到線程已經(jīng)終止執(zhí)行
- 對象終結(jié)規(guī)則:一個(gè)對象的初始化完成先行發(fā)生于他的finalize()方法的開始
這8條原則摘自《深入理解java虛擬機(jī)》。這8條規(guī)則中,前4條規(guī)則是比較重要的,后4條規(guī)則都是顯而易見的。
下面我們來解釋一下前4條規(guī)則:
對于程序次序規(guī)則來說,我的理解就是一段程序代碼的執(zhí)行在單個(gè)線程中看起來是有序的。注意,雖然這條規(guī)則中提到“書寫在前面的操作先行發(fā)生于書寫在后面的操作”,這個(gè)應(yīng)該是程序看起來執(zhí)行的順序是按照代碼順序執(zhí)行的,因?yàn)樘摂M機(jī)可能會(huì)對程序代碼進(jìn)行指令重排序。雖然進(jìn)行重排序,但是最終執(zhí)行的結(jié)果是與程序順序執(zhí)行的結(jié)果一致的,它只會(huì)對不存在數(shù)據(jù)依賴性的指令進(jìn)行重排序。因此,在單個(gè)線程中,程序執(zhí)行看起來是有序執(zhí)行的,這一點(diǎn)要注意理解。事實(shí)上,這個(gè)規(guī)則是用來保證程序在單線程中執(zhí)行結(jié)果的正確性,但無法保證程序在多線程中執(zhí)行的正確性。
第二條規(guī)則也比較容易理解,也就是說無論在單線程中還是多線程中,同一個(gè)鎖如果出于被鎖定的狀態(tài),那么必須先對鎖進(jìn)行了釋放操作,后面才能繼續(xù)進(jìn)行l(wèi)ock操作。
第三條規(guī)則是一條比較重要的規(guī)則,也是后文將要重點(diǎn)講述的內(nèi)容。直觀地解釋就是,如果一個(gè)線程先去寫一個(gè)變量,然后一個(gè)線程去進(jìn)行讀取,那么寫入操作肯定會(huì)先行發(fā)生于讀操作。
第四條規(guī)則實(shí)際上就是體現(xiàn)happens-before原則具備傳遞性。
四.深入剖析volatile關(guān)鍵字
在前面講述了很多東西,其實(shí)都是為講述volatile關(guān)鍵字作鋪墊,那么接下來我們就進(jìn)入主題。
1.volatile關(guān)鍵字的兩層語義
一旦一個(gè)共享變量(類的成員變量、類的靜態(tài)成員變量)被volatile修飾之后,那么就具備了兩層語義:
- 1)保證了不同線程對這個(gè)變量進(jìn)行操作時(shí)的可見性,即一個(gè)線程修改了某個(gè)變量的值,這新值對其他線程來說是立即可見的。
- 2)禁止進(jìn)行指令重排序。
先看一段代碼,假如線程1先執(zhí)行,線程2后執(zhí)行:
//線程1 boolean stop = false; while(!stop){ dosomething(); } //線程2 stop = true;
這段代碼是很典型的一段代碼,很多人在中斷線程時(shí)可能都會(huì)采用這種標(biāo)記辦法。但是事實(shí)上,這段代碼會(huì)完全運(yùn)行正確么?即一定會(huì)將線程中斷么?不一定,也許在大多數(shù)時(shí)候,這個(gè)代碼能夠把線程中斷,但是也有可能會(huì)導(dǎo)致無法中斷線程(雖然這個(gè)可能性很小,但是只要一旦發(fā)生這種情況就會(huì)造成死循環(huán)了)。
下面解釋一下這段代碼為何有可能導(dǎo)致無法中斷線程。在前面已經(jīng)解釋過,每個(gè)線程在運(yùn)行過程中都有自己的工作內(nèi)存,那么線程1在運(yùn)行的時(shí)候,會(huì)將stop變量的值拷貝一份放在自己的工作內(nèi)存當(dāng)中。
那么當(dāng)線程2更改了stop變量的值之后,但是還沒來得及寫入主存當(dāng)中,線程2轉(zhuǎn)去做其他事情了,那么線程1由于不知道線程2對stop變量的更改,因此還會(huì)一直循環(huán)下去。
但是用volatile修飾之后就變得不一樣了:
第一:使用volatile關(guān)鍵字會(huì)強(qiáng)制將修改的值立即寫入主存;
第二:使用volatile關(guān)鍵字的話,當(dāng)線程2進(jìn)行修改時(shí),會(huì)導(dǎo)致線程1的工作內(nèi)存中緩存變量stop的緩存行無效(反映到硬件層的話,就是cpu的l1或者l2緩存中對應(yīng)的緩存行無效);
第三:由于線程1的工作內(nèi)存中緩存變量stop的緩存行無效,所以線程1再次讀取變量stop的值時(shí)會(huì)去主存讀取。
那么在線程2修改stop值時(shí)(當(dāng)然這里包括2個(gè)操作,修改線程2工作內(nèi)存中的值,然后將修改后的值寫入內(nèi)存),會(huì)使得線程1的工作內(nèi)存中緩存變量stop的緩存行無效,然后線程1讀取時(shí),發(fā)現(xiàn)自己的緩存行無效,它會(huì)等待緩存行對應(yīng)的主存地址被更新之后,然后去對應(yīng)的主存讀取最新的值。
那么線程1讀取到的就是最新的正確的值。
2.volatile保證原子性嗎?
從上面知道volatile關(guān)鍵字保證了操作的可見性,但是volatile能保證對變量的操作是原子性嗎?
下面看一個(gè)例子:
public class test { public volatile int inc = 0; public void increase() { inc++; } public static void main(string[] args) { final test test = new test(); for(int i=0;i<10;i++){ new thread(){ public void run() { for(int j=0;j<1000;j++) test.increase(); }; }.start(); } while(thread.activecount()>1) //保證前面的線程都執(zhí)行完 thread.yield(); system.out.println(test.inc); } }
大家想一下這段程序的輸出結(jié)果是多少?也許有些朋友認(rèn)為是10000。但是事實(shí)上運(yùn)行它會(huì)發(fā)現(xiàn)每次運(yùn)行結(jié)果都不一致,都是一個(gè)小于10000的數(shù)字??赡苡械呐笥丫蜁?huì)有疑問,不對啊,上面是對變量inc進(jìn)行自增操作,由于volatile保證了可見性,那么在每個(gè)線程中對inc自增完之后,在其他線程中都能看到修改后的值啊,所以有10個(gè)線程分別進(jìn)行了1000次操作,那么最終inc的值應(yīng)該是1000*10=10000。
這里面就有一個(gè)誤區(qū)了,volatile關(guān)鍵字能保證可見性沒有錯(cuò),但是上面的程序錯(cuò)在沒能保證原子性??梢娦灾荒鼙WC每次讀取的是最新的值,但是volatile沒辦法保證對變量的操作的原子性。
在前面已經(jīng)提到過,自增操作是不具備原子性的,它包括讀取變量的原始值、進(jìn)行加1操作、寫入工作內(nèi)存。那么就是說自增操作的三個(gè)子操作可能會(huì)分割開執(zhí)行,就有可能導(dǎo)致下面這種情況出現(xiàn):
假如某個(gè)時(shí)刻變量inc的值為10,線程1對變量進(jìn)行自增操作,線程1先讀取了變量inc的原始值,然后線程1被阻塞了;然后線程2對變量進(jìn)行自增操作,線程2也去讀取變量inc的原始值,由于線程1只是對變量inc進(jìn)行讀取操作,而沒有對變量進(jìn)行修改操作,所以不會(huì)導(dǎo)致線程2的工作內(nèi)存中緩存變量inc的緩存行無效,所以線程2會(huì)直接去主存讀取inc的值,發(fā)現(xiàn)inc的值時(shí)10,然后進(jìn)行加1操作,并把11寫入工作內(nèi)存,最后寫入主存。
然后線程1接著進(jìn)行加1操作,由于已經(jīng)讀取了inc的值,注意此時(shí)在線程1的工作內(nèi)存中inc的值仍然為10,所以線程1對inc進(jìn)行加1操作后inc的值為11,然后將11寫入工作內(nèi)存,最后寫入主存。那么兩個(gè)線程分別進(jìn)行了一次自增操作后,inc只增加了1。
解釋到這里,可能有朋友會(huì)有疑問,不對啊,前面不是保證一個(gè)變量在修改volatile變量時(shí),會(huì)讓緩存行無效嗎?然后其他線程去讀就會(huì)讀到新的值,對,這個(gè)沒錯(cuò)。這個(gè)就是上面的happens-before規(guī)則中的volatile變量規(guī)則,但是要注意,線程1對變量進(jìn)行讀取操作之后,被阻塞了的話,并沒有對inc值進(jìn)行修改。然后雖然volatile能保證線程2對變量inc的值讀取是從內(nèi)存中讀取的,但是線程1沒有進(jìn)行修改,所以線程2根本就不會(huì)看到修改的值。
根源就在這里,自增操作不是原子性操作,而且volatile也無法保證對變量的任何操作都是原子性的。
把上面的代碼改成以下任何一種都可以達(dá)到效果:
采用synchronized:
public class test { public int inc = 0; public synchronized void increase() { inc++; } public static void main(string[] args) { final test test = new test(); for(int i=0;i<10;i++){ new thread(){ public void run() { for(int j=0;j<1000;j++) test.increase(); }; }.start(); } while(thread.activecount()>1) //保證前面的線程都執(zhí)行完 thread.yield(); system.out.println(test.inc); } }
采用lock:
public class test { public int inc = 0; lock lock = new reentrantlock(); public void increase() { lock.lock(); try { inc++; } finally{ lock.unlock(); } } public static void main(string[] args) { final test test = new test(); for(int i=0;i<10;i++){ new thread(){ public void run() { for(int j=0;j<1000;j++) test.increase(); }; }.start(); } while(thread.activecount()>1) //保證前面的線程都執(zhí)行完 thread.yield(); system.out.println(test.inc); } }
采用atomicinteger:
public class test { public atomicinteger inc = new atomicinteger(); public void increase() { inc.getandincrement(); } public static void main(string[] args) { final test test = new test(); for(int i=0;i<10;i++){ new thread(){ public void run() { for(int j=0;j<1000;j++) test.increase(); }; }.start(); } while(thread.activecount()>1) //保證前面的線程都執(zhí)行完 thread.yield(); system.out.println(test.inc); } }
在java 1.5的java.util.concurrent.atomic包下提供了一些原子操作類,即對基本數(shù)據(jù)類型的 自增(加1操作),自減(減1操作)、以及加法操作(加一個(gè)數(shù)),減法操作(減一個(gè)數(shù))進(jìn)行了封裝,保證這些操作是原子性操作。atomic是利用cas來實(shí)現(xiàn)原子性操作的(compare and swap),cas實(shí)際上是利用處理器提供的cmpxchg指令實(shí)現(xiàn)的,而處理器執(zhí)行cmpxchg指令是一個(gè)原子性操作。
3.volatile能保證有序性嗎?
在前面提到volatile關(guān)鍵字能禁止指令重排序,所以volatile能在一定程度上保證有序性。
volatile關(guān)鍵字禁止指令重排序有兩層意思:
1)當(dāng)程序執(zhí)行到volatile變量的讀操作或者寫操作時(shí),在其前面的操作的更改肯定全部已經(jīng)進(jìn)行,且結(jié)果已經(jīng)對后面的操作可見;在其后面的操作肯定還沒有進(jìn)行;
2)在進(jìn)行指令優(yōu)化時(shí),不能將在對volatile變量訪問的語句放在其后面執(zhí)行,也不能把volatile變量后面的語句放到其前面執(zhí)行。
可能上面說的比較繞,舉個(gè)簡單的例子:
//x、y為非volatile變量 //flag為volatile變量 x = 2; //語句1 y = 0; //語句2 flag = true; //語句3 x = 4; //語句4 y = -1; //語句5
由于flag變量為volatile變量,那么在進(jìn)行指令重排序的過程的時(shí)候,不會(huì)將語句3放到語句1、語句2前面,也不會(huì)講語句3放到語句4、語句5后面。但是要注意語句1和語句2的順序、語句4和語句5的順序是不作任何保證的。并且volatile關(guān)鍵字能保證,執(zhí)行到語句3時(shí),語句1和語句2必定是執(zhí)行完畢了的,且語句1和語句2的執(zhí)行結(jié)果對語句3、語句4、語句5是可見的。
那么我們回到前面舉的一個(gè)例子:
//線程1: context = loadcontext(); //語句1 inited = true; //語句2 //線程2: while(!inited ){ sleep() } dosomethingwithconfig(context);
前面舉這個(gè)例子的時(shí)候,提到有可能語句2會(huì)在語句1之前執(zhí)行,那么久可能導(dǎo)致context還沒被初始化,而線程2中就使用未初始化的context去進(jìn)行操作,導(dǎo)致程序出錯(cuò)。這里如果用volatile關(guān)鍵字對inited變量進(jìn)行修飾,就不會(huì)出現(xiàn)這種問題了,因?yàn)楫?dāng)執(zhí)行到語句2時(shí),必定能保證context已經(jīng)初始化完畢。
4.volatile的原理和實(shí)現(xiàn)機(jī)制
前面講述了源于volatile關(guān)鍵字的一些使用,下面我們來探討一下volatile到底如何保證可見性和禁止指令重排序的。
下面這段話摘自《深入理解java虛擬機(jī)》:
“觀察加入volatile關(guān)鍵字和沒有加入volatile關(guān)鍵字時(shí)所生成的匯編代碼發(fā)現(xiàn),加入volatile關(guān)鍵字時(shí),會(huì)多出一個(gè)lock前綴指令”
lock前綴指令實(shí)際上相當(dāng)于一個(gè)內(nèi)存屏障(也成內(nèi)存柵欄),內(nèi)存屏障會(huì)提供3個(gè)功能:
- 1)它確保指令重排序時(shí)不會(huì)把其后面的指令排到內(nèi)存屏障之前的位置,也不會(huì)把前面的指令排到內(nèi)存屏障的后面;即在執(zhí)行到內(nèi)存屏障這句指令時(shí),在它前面的操作已經(jīng)全部完成;
- 2)它會(huì)強(qiáng)制將對緩存的修改操作立即寫入主存;
- 3)如果是寫操作,它會(huì)導(dǎo)致其他cpu中對應(yīng)的緩存行無效。
五.使用volatile關(guān)鍵字的場景
synchronized關(guān)鍵字是防止多個(gè)線程同時(shí)執(zhí)行一段代碼,那么就會(huì)很影響程序執(zhí)行效率,而volatile關(guān)鍵字在某些情況下性能要優(yōu)于synchronized,但是要注意volatile關(guān)鍵字是無法替代synchronized關(guān)鍵字的,因?yàn)関olatile關(guān)鍵字無法保證操作的原子性。通常來說,使用volatile必須具備以下2個(gè)條件:
- 1)對變量的寫操作不依賴于當(dāng)前值
- 2)該變量沒有包含在具有其他變量的不變式中
實(shí)際上,這些條件表明,可以被寫入 volatile 變量的這些有效值獨(dú)立于任何程序的狀態(tài),包括變量的當(dāng)前狀態(tài)。事實(shí)上,我的理解就是上面的2個(gè)條件需要保證操作是原子性操作,才能保證使用volatile關(guān)鍵字的程序在并發(fā)時(shí)能夠正確執(zhí)行。
下面列舉幾個(gè)java中使用volatile的幾個(gè)場景。
1.狀態(tài)標(biāo)記量
volatile boolean flag = false; while(!flag){ dosomething(); } public void setflag() { flag = true; }
volatile boolean inited = false; //線程1: context = loadcontext(); inited = true; //線程2: while(!inited ){ sleep() } dosomethingwithconfig(context);
2.double check
class singleton{ private volatile static singleton instance = null; private singleton() { } public static singleton getinstance() { if(instance==null) { synchronized (singleton.class) { if(instance==null) instance = new singleton(); } } return instance; } }