1.索引不存儲null值。
更準確的說,單列索引不存儲null值,復合索引不存儲全為null的值。索引不能存儲Null,所以對這列采用is null條件時,因為索引上根本沒Null值,不能利用到索引,只能全表掃描。
為什么索引列不能存Null值?將索引列值進行建樹,其中必然涉及到諸多的比較操作。Null值的特殊性就在于參與的運算大多取值為null。
這樣的話,null值實際上是不能參與進建索引的過程。也就是說,null值不會像其他取值一樣出現(xiàn)在索引樹的葉子節(jié)點上。
2.不適合鍵值較少的列(重復數據較多的列)。假如索引列TYPE有5個鍵值,如果有1萬條數據,那么 WHERE TYPE = 1將訪問表中的2000個數據塊。
再加上訪問索引塊,一共要訪問大于200個的數據塊。如果全表掃描,假設10條數據一個數據塊,那么只需訪問1000個數據塊,既然全表掃描訪問的數據塊少一些,肯定就不會利用索引了。
3.前導模糊查詢不能利用索引(like '%XX'或者like '%XX%')假如有這樣一列code的值為'AAA','AAB','BAA','BAB' ,如果where code like '%AB'條件,由于前面是模糊的,所以不能利用索引的順序,必須一個個去找,看是否滿足條件。這樣會導致全索引掃描或者全表掃描。
如果是這樣的條件where code like 'A % ',就可以查找CODE中A開頭的CODE的位置,當碰到B開頭的數據時,就可以停止查找了,因為后面的數據一定不滿足要求。這樣就可以利用索引了。
4.MySQL主要提供2種方式的索引:B-Tree索引,Hash索引。B樹索引具有范圍查找和前綴查找的能力,對于有N節(jié)點的B樹,檢索一條記錄的復雜度為O(LogN)。
相當于二分查找。哈希索引只能做等于查找,但是無論多大的Hash表,查找復雜度都是O(1)。
顯然,如果值的差異性大,并且以等值查找(=、、in)為主,Hash索引是更高效的選擇,它有O(1)的查找復雜度。如果值的差異性相對較差,并且以范圍查找為主,B樹是更好的選擇,它支持范圍查找。
索引是建立在數據庫表中的某些列的上面。在創(chuàng)建索引的時候,應該考慮在哪些列上可以創(chuàng)建索引,在哪些列上不能創(chuàng)建索引。一般來說,應該在這些列上創(chuàng)建索引:
在經常需要搜索的列上,可以加快搜索的速度;
在作為主鍵的列上,強制該列的唯一性和組織表中數據的排列結構;
在經常用在連接的列上,這些列主要是一些外鍵,可以加快連接的速度;在經常需要根據范圍進行搜索的列上創(chuàng)建索引,因為索引已經排序,其指定的范圍是連續(xù)的;
在經常需要排序的列上創(chuàng)建索引,因為索引已經排序,這樣查詢可以利用索引的排序,加快排序查詢時間;
在經常使用在WHERE子句中的列上面創(chuàng)建索引,加快條件的判斷速度。
同樣,對于有些列不應該創(chuàng)建索引。一般來說,不應該創(chuàng)建索引的這些列具有下列特點:
第一,對于那些在查詢中很少使用或者參考的列不應該創(chuàng)建索引。這是因為,既然這些列很少使用到,因此有索引或者無索引,并不能提高查詢速度。相反,由于增加了索引,反而降低了系統(tǒng)的維護速度和增大了空間需求。
第二,對于那些只有很少數據值的列也不應該增加索引。這是因為,由于這些列的取值很少,例如人事表的性別列,在查詢的結果中,結果集的數據行占了表中數據行的很大比例,即需要在表中搜索的數據行的比例很大。增加索引,并不能明顯加快檢索速度。
第三,對于那些定義為text, image和bit數據類型的列不應該增加索引。這是因為,這些列的數據量要么相當大,要么取值很少,不利于使用索引。
第四,當修改性能遠遠大于檢索性能時,不應該創(chuàng)建索引。這是因為,修改性能和檢索性能是互相矛盾的。當增加索引時,會提高檢索性能,但是會降低修改性能。當減少索引時,會提高修改性能,降低檢索性能。因此,當修改操作遠遠多于檢索操作時,不應該創(chuàng)建索引。
1.索引不存儲null值。
更準確的說,單列索引不存儲null值,復合索引不存儲全為null的值。索引不能存儲Null,所以對這列采用is null條件時,因為索引上根本沒Null值,不能利用到索引,只能全表掃描。
為什么索引列不能存Null值?
將索引列值進行建樹,其中必然涉及到諸多的比較操作。Null值的特殊性就在于參與的運算大多取值為null。這樣的話,null值實際上是不能參與進建索引的過程。也就是說,null值不會像其他取值一樣出現(xiàn)在索引樹的葉子節(jié)點上。
2.不適合鍵值較少的列(重復數據較多的列)。
假如索引列TYPE有5個鍵值,如果有1萬條數據,那么 WHERE TYPE = 1將訪問表中的2000個數據塊。
再加上訪問索引塊,一共要訪問大于200個的數據塊。
如果全表掃描,假設10條數據一個數據塊,那么只需訪問1000個數據塊,既然全表掃描訪問的數據塊少一些,肯定就不會利用索引了。
3.前導模糊查詢不能利用索引(like '%XX'或者like '%XX%')
假如有這樣一列code的值為'AAA','AAB','BAA','BAB' ,如果where code like '%AB'條件,由于前面是模糊的,所以不能利用索引的順序,必須一個個去找,看是否滿足條件。這樣會導致全索引掃描或者全表掃描。如果是這樣的條件where code like 'A % ',就可以查找CODE中A開頭的CODE的位置,當碰到B開頭的數據時,就可以停止查找了,因為后面的數據一定不滿足要求。這樣就可以利用索引了。
4.MySQL主要提供2種方式的索引:B-Tree索引,Hash索引。
B樹索引具有范圍查找和前綴查找的能力,對于有N節(jié)點的B樹,檢索一條記錄的復雜度為O(LogN)。相當于二分查找。
哈希索引只能做等于查找,但是無論多大的Hash表,查找復雜度都是O(1)。
顯然,如果值的差異性大,并且以等值查找(=、<;、>;、in)為主,Hash索引是更高效的選擇,它有O(1)的查找復雜度。
如果值的差異性相對較差,并且以范圍查找為主,B樹是更好的選擇,它支持范圍查找。
并非所有的數據庫都以相同的方式使用索引。
作為通用規(guī)則,只有當經常查詢索引列中的數據時,才需要在表上創(chuàng)建索引。索引占用磁盤空間,并且降低添加、刪除和更新行的速度。
在多數情況下,索引用于數據檢索的速度優(yōu)勢大大超過它的不足之處。但是,如果應用程序非常頻繁地更新數據或磁盤空間有限,則可能需要限制索引的數量。
可以基于數據庫表中的單列或多列創(chuàng)建索引。多列索引使您可以區(qū)分其中一列可能有相同值的行。
如果經常同時搜索兩列或多列或按兩列或多列排序時,索引也很有幫助。例如,如果經常在同一查詢中為姓和名兩列設置判據,那么在這兩列上創(chuàng)建多列索引將很有意義。
確定索引的有效性:檢查查詢的 WHERE 和 JOIN 子句。在任一子句中包括的每一列都是索引可以選擇的對象。
對新索引進行試驗以檢查它對運行查詢性能的影響。考慮已在表上創(chuàng)建的索引數量。
最好避免在單個表上有很多索引。檢查已在表上創(chuàng)建的索引的定義。
最好避免包含共享列的重疊索引。檢查某列中唯一數據值的數量,并將該數量與表中的行數進行比較。
比較的結果就是該列的可選擇性,這有助于確定該列是否適合建立索引,如果適合,確定索引的類型。
聲明:本網站尊重并保護知識產權,根據《信息網絡傳播權保護條例》,如果我們轉載的作品侵犯了您的權利,請在一個月內通知我們,我們會及時刪除。
蜀ICP備2020033479號-4 Copyright ? 2016 學習鳥. 頁面生成時間:4.217秒