【Java】集合类 - 集合框架

Posted by 西维蜀黍 on 2019-03-15, Last Modified on 2023-02-28

集合框架

Collection接口

集合框架(均实现了Collection接口)有自己的接口和实现,主要分为Set接口,List接口和Queue接口。

它们有各自的特点:

  • Set接口里存放的对象是无序,不能重复的,集合中的对象不按特定的方式排序,只是简单地把对象加入集合中。
  • List接口是一个有序的集合,同时也是可以重复的,List关注的是索引,拥有一系列和索引相关的方法,查询速度快。因为往list集合里插入或删除数据时,会伴随着后面数据的移动,所有插入删除数据速度慢。
  • Queue接口的工作原理是 FCFS 算法(First Come, First Serve)。

Map接口

Map接口并未继承Collection接口。

Map接口中存储的是键值对,键不能重复,值可以重复。根据键得到值,对map集合遍历时先得到键的set集合,对set集合进行遍历,得到相应的值。

对比

有序性 允许元素重复否
Collection
List
Set AbstractSet
Set HashSet
Set TreeSet 是(用二叉树排序)
Map AbstractMap 使用key-value来映射和存储数据,Key必须惟一,value可以重复
Map HashMap 使用key-value来映射和存储数据,Key必须惟一,value可以重复
Map TreeMap 是(用二叉树排序) 使用key-value来映射和存储数据,Key必须惟一,value可以重复

List接口

List 接口对Collection接口进行了简单的扩充,它的具体实现类常用的有ArrayList、LinkedList和Vector。

实现 List 接口的数据结构允许重复元素,可通过 index 访问元素。

ArrayList从其命名中可以看出它是一种类似数组的形式进行存储,因此它的随机访问速度极快。

而LinkedList的内部实现是链表,它适合于在链表中间需要频繁进行插入和删除操作。

Set接口

Set接口也是 Collection的一种扩展,而与List不同的时,在Set中的对象元素不能重复,也就是说你不能把同样的东西两次放入同一个Set容器中。它的常用具体实现有HashSet、LinkedHashSet和TreeSet类。

HashSet能快速定位一个元素,但是你放到HashSet中的对象需要实现hashCode()方法。

而TreeSet则将放入其中的元素按某种指定的顺序存放,这就要求你放入其中的对象是可排序的。

Queue接口

队列(Queue)是计算机中的一种数据结构,保存在其中的数据具有“先进先出(FIFO,First In First Out)”的特性。

队列具体的实现有很多种办法,例如,可以使用数组做存储,可以使用链表做存储。

队列的两种形式

在Java中,队列分为2种形式:

  • 单向队列
  • 循环队列(Deque)

Map接口

Map接口是一种把键对象(key)和值对象(value)进行关联的容器,而一个值对象又可以是一个Map,依次类推,这样就可形成一个多级映射。

对于键对象来说,像Set一样,一个Map容器中的键对象不允许重复,这是为了保持查找结果的一致性;如果有两个键对象一样,那你想得到那个键对象所对应的值对象时就有问题了,可能你得到的并不是你想的那个值对象,结果会造成混乱,所以键的唯一性很重要,也是符合集合的性质的。

当然在使用过程中,某个键所对应的值对象可能会发生变化,这时会按照最后一次修改的值对象与键对应。对于值对象则没有唯一性的要求。你可以将任意多个键都映射到一个值对象上,这不会发生任何问题(不过对你的使用却可能会造成不便,你不知道你得到的到底是那一个键所对应的值对象)。

Map接口有两种比较常用的实现: HashMap和TreeMap。

TreeMap保存了对象的排列次序,而HashMap则不能。

HashMap用到了哈希码的算法,以便快速查找一个键.

TreeMap则是对键按序存放,因此它便有一些扩展的方法,比如firstKey(),lastKey()等,你还可以从TreeMap中指定一个范围以取得其子Map。键和值的关联很简单,用pub (Object key,Object value)方法即可将一个键与一个值对象相关联。用get(Object key)可得到与此key对象所对应的值对象。

遍历

在类集中提供了以下四种的常见输出方式:

  • for循环
  • foreach输出:JDK1.5之后提供的新功能,可以输出数组或集合。
  • Iterator:迭代输出,是使用最多的输出方式。

for的形式

forint i=0; i<arr.size(); i++ {
    ...
}

foreach的形式

forint iarr{
    ...
}

iterator(迭代器)的形式

Iterator it = arr.iterator();
while(it.hasNext()){ 
	object o =it.next(); 
	...
}

Fast-fail 规则

快速失败(fail-fast)在用迭代器(iterator)遍历一个集合对象时,如果遍历过程中通过集合对象并使其内容发生了修改(增加、删除、修改),则会抛出ConcurrentModificationException

迭代器在遍历时直接访问集合中的内容,并且在遍历过程中使用一个 modCount 变量。集合在被遍历期间如果内容发生变化,就会改变 modCount 的值。每当迭代器使用hasNext()/next() 遍历下一个元素之前,都会检测 modCount 变量是否为expectedmodCount 值,是的话就返回遍历值;否则抛出异常,终止遍历。

注意,java.util包下的集合类都是快速失败的,不能在多线程下发生并发修改(迭代过程中被修改)。

Reference