foresight 发布的帖子

foresight

泛型--<? extends T> 和 <? super T>

基本介绍

<? extends T> 是指 “上界通配符（Upper Bounds Wildcards）”
- 表示类型的上界，表示参数化类型的可能是T或是T的子类;
- ```
//例子
//表示一个能放水果以及一切是水果派生类的盘子
Plate<？ extends Fruit>
```
<? super T> 是指 “下界通配符（Lower Bounds Wildcards）”
- 表示类型下界（Java Core中叫超类型限定），表示参数化类型是此类型的超类型（父类型），直至Object;
- ```
//例子
//一个能放水果以及一切是水果基类的盘子
Plate<？ super Fruit>
```

使用

上界<? extends T>不能往里存，只能往外取

set()方法失效，get()方法还有效

Plate<? extends Fruit> fruitPlate = new Plate<Apple>(new Apple());

//不能存入任何元素
fruitPlate.set(new Apple());    //Error  编译错误
fruitPlate.set(new Fruit());    //Error  编译错误

//读取出来的东西只能放在Fruit或它的基类里
Fruit newFruit1=fruitPlate.get();
Object newFruit2 = fruitPlate.get();
Apple newFruit3 = fruitPlate.get();  //Error

下界<? super T>不影响往里存，但往外取只能放在Object对象里

get( )方法部分失效，只能存放到Object对象里;set( )方法正常。

Plate<? super Fruit> fruitPlate = new Plate<Fruit>(new Fruit());

//存入元素正常
fruitPlate.set(new Apple());
fruitPlate.set(new Fruit());

//读取出来的东西只能存放在Object类里
Object newFruit1 = fruitPlate.get();
Fruit newFruit2 = fruitPlate.get();  //Error
Apple newFruit3 = fruitPlate.get();  //Error

PECS原则

PECS（Producer Extends Consumer Super）原则:
- 频繁往外读取内容的，适合用上界Extends。
- 经常往里插入的，适合用下界Super。

foresight

@throwingup 首先你要有一个对象，然后就拥有了OOA、OOD、OOP的能力。

foresight

枚举和注解

enum（枚举）和annotationType（注解类型）

用enum代替int常量

enum type是指由一组固定的常量组合成合法值的类型，例如一年中的季节，一副牌的花色；

//在还没有引入枚举类型之前，常用模式是声明一组具名的int常量
//称为int枚举模式
public static final int APPLE_FUJI = 0;
public static final int APPLE_PIPPIN = 1;
public static final int APPLE_GRANNY_SMITH = 2;

//类型安全的枚举
public enum Apple {FUJI,PIPPIN,GRANNY_SMITH}
public enum Orange {NAVEL,TEMPLE,BLOOD}

public enum Planet{
  //行星
  MERCURY(...,...);
  VENUS(...,...);
  EARTH(...,...);
  
  private final double mass;
  private final double radius;
  private final double surfaceGravity;
  
  private static final double G = 6.63;
  
  Planet(double mass,double radius){
    this.mass = mass;
    this.radius = radius;
    surfaceGravity = G*mass/(radius*radius);
  }
  
  public double mass(){return mass;}
  public double radius(){return radius;}
  public double surfaceGravity(){return surfaceGravity;}

  public double surfaceWeight(double mass){
    return mass*surfaceGravity;
  }
}

//运算
public enum Operation{
  PLUS,MINUS,TIMES,DIVIDE;
  
  double apply(double x,double y){
    switch(this){
      case PLUS: 		return x+y;
      case MINUS: 	return x-y;
      case Times: 	return x*y;
      case DIVIDE: 	return x/y;
    }
    throw new AssertionError("Unknow op:"+this);
  }
}

//运算
public enum Operation{
  PLUS		{double apply(double x,double y){return x+y;}},
  MINUS		{double apply(double x,double y){return x-y;}},
  TIMES		{double apply(double x,double y){return x*y;}},
  DIVIDE	{double apply(double x,double y){return x/y;}};
  
  abstract double apply(double x,double y);
}

//特定于常量的方法实现可以与特定于常量的数据结合起来
public enum Operation{
  PLUS("+"){
    double apply(double x,double y){return x+y;}
  },
  MINUS("-"){
    double apply(double x,double y){return x-y;}
  },
  TIMES("*"){
    double apply(double x,double y){return x*y;}
  },
  DIVIDE("/")	{
    double apply(double x,double y){return x/y;}
  };
  
  private final String symbol;
  Operation(String symbol){this.symbol = symbol;}
  @override public String toString(){return symbol;}//覆盖toString方法
  
  abstract double apply(double x,double y);
}

用实例域代替序数
- 枚举都天生和一个int值相关，所有枚举都有一个ordinal方法，它返回每个枚举在类型中的数字位置，从序数中得到关联的int值
```
public enum Ensemble{
  SOLO,		DUET,		TRIO,	QUARTET,	QUINTET,
  SEXTET,	SEPTET,	OCTET,NONET,		DECTET;
  
  public int numberOfMusicians(){return ordinal()+1;}
}
```
用EnumSet代替位域
- 如果一个枚举类型的元素主要用在集合中，一般就使用int枚举模式
- Java.util包提供了EnumSet类来有效地表示从单个枚举类型中提取的多个值的多个集合。
- ```
public class Text{
  public enum Style{BOLD,ITALIC,UNDERLINE,STRIKETHROUGH}
  
  public void applyStyle(Set<Style> style){...}
}

//使用
text.applyStyle(EnumSet.of(Style.BOLD,Style.TTALIC));
```

用EnumMap代替序数索引

ordinal方法：获取索引

//例子：表示一种烹饪用的香草
public class Herb{
  public enum Type{ANNUAL,PERENNIAL,BIENNIAL}
  
  private final String name;
  private final Type type;
  
  Herb(String name,Type type){
    this.name = name;
    this.type = type;
  }
  
  @Override public String toString(){
    return name;
  }
}

//假设有一个香草数组，表示一座花园中的植物，下面要按照类型进行组织后将植物列出来
//1.可以构建三个集合，并遍历整个花园，分别放入相应的集合
//2.将这些集合放到一个按照类型的叙述进行索引的数组中来实现
Herb[] garden = ...;

Set<Herb>[] herbsByType = (Set<Herb>[]) new Set[Herb.Type.values().length];
for(int i = 0;i<herbsByType.length;i++) herbsByType[h.type.ordinal)()].add(h);

for(Herb h:garden) herbsByType[h.type.ordinal()].add(h);

//Print the results
for(int i = 0;i <herbsBytype.length;i++){
  System.out.printf("%s:%s%n",Herb.Type.values()[i],herbsByType[i]);
}

有一种更好的方法可以达到同样的效果，数组实际上充当着从枚举到值的映射，因此可能还要用到Map。称作EnumMap

Map<Herb.Type,Set<Herb>> herbsByType = new EnumMap<Herb.Type,Set<Herb>>(Herb.Type.class);
for(Herb.Type t : Herb.Type.values())
  herbsByType.put(t,new HashSet<Herb>());
for(Herb h:garden)
  herbsByType.get(h.type).add(h);
System.out.println(herbsByType);

用接口模拟可伸缩的枚举

public interface Operation{
  double apply(double x,double y);
}

public enum BasicOperation,implements Operation{
  PLUS("+"){
    public double apply(double x,double y){return x+y;}
  },
  MINUS("-"){
    public double apply(double x,double y){return x -y ;}
  };
  
  private final String symbol;
  BasicOperation(String symbol){
    this.symbol = symbol;
  }
  @Override public String toString(){
    return symbol;
  }
}

//使用
public static <T extends Enum<T> & Operation> void test(Class<T> opSet,double x,double y){
  for(Operation op:opSet.getEnumConstants()){
    System.out.printf(op.apply(x,y));
  }
}

opSet参数中公认很复杂的声明(<T extends Enum<T> & Operation> Class<T>)确保了Class对象既表示枚举又表示Operation的子类型，还有一种方法是使用Collection<? Extends Operation>

public static void test(Collection<? extends Operation> opSet,double x,double y){
  for(Operation op:opSet){
    ...
  }
}

注解优先于命名模式

Java1.5发行前，一般使用命名模式表明有些程序需要通过某些工具或者框架进行特殊处理

命名模式有几个很严重的缺点：
- 命名错误不会报错
- 无法确定他们只用于相应的程序元素上
- 没有提供将参数值与程序元素关联起来的好方法
注解很好的解决了这个问题:
```
import java.lang.annotation.*;

@Retention(RetentionPolicy.RUNTIME)
@Target(ElementType.METHOD)
public @interface Test{
}
```
- Test注解类型的声明就是它自身通过Retention和Target注解进行了注解。注解类型声明中的这种注解被称作元注解(meta-annotation).@Retention(RetentionPolicy.RUNTIME)元注解表明，Test注解应该在运行时保留，如果没有保留，测试工具就无法知道test注解@Target(Element.METHOD)元注解表明，Test注解只在方法声明中才是合法的：他不能运用到类声明、域声明或者其他程序元素上。
- 应用Test注解，称作标记注解(marker annotation),因为它没有参数，只是标注被注解的元素。如果程序员拼错了Test，或者将Test注解应用到程序元素而非方法声明，程序就无法编译。
```
public class Sample{
  @Test public static void m1(){} //Test should pass
  public static void m2(){}				
  @Test public static void m3(){	//test should fail
    throw new RuntimeException("Boom");
  }
  public static void m4(){}
  @Test public void m5(){}				//INVALID USE:nonstatic method
  public static void m6(){}
  @Test public static void m7(){	//Test should fail
    throw new RuntimeException("Crash");
  }
  public static void m8(){ }
}

//Sample包含四项测试：一项会通过，两项会失败，另一项无效，没有标注的4个方法会被测试工具忽略
```

注解永远不会改变被注解代码的语义，但是使他可以通过工具进行特殊的处理

//测试注解
public class RunTests{
  public static void main(String[] args) throws Exception{
    int tests = 0;
    int passed = 0;
    Class testClass = Class.forName(args[0]);
    //运行类中的所有方法
    for(Method m : testClass.getDeclaredMethods()){
      if(m.isAnnotationPresent(Test.class)){
        tests++;
        try{
          m.invoke(null);
          passed++;
        }catch(InvocationTargetException wrappedExc){
          Throwable exc = wrappedExc.getCause();
          System.out.println(m+"failed"+exc);
        }catch(Exception exc){
          System.out.println("INVALID @Test:"+m);
        }
      }
    }
    System.out.printf("Passed:%d,Failed:%d%n",passed,tests-passed);
  }
}

//output
public sta
Passed:1,Failed:3

坚持使用Override注解

@override注解只能用在方法声明中。表示被注解的方法声明覆盖了超类中的一个声明，如果坚持使用这个注解，可以防止一大类非法错误

public class Bigram{
  private final char first;
  private final char second;
  public Bigram(char first,char second){
    this.first = first;
    this.second = second;
  }
  public boolean equals(Bigram b){
    return b.first == first && b.second == second;
  }
  public int hashCode(){
    return 31*first + second;
  }
  public static void main(String[] args){
    Set<Bigram> s = new HashSet<Bigram>();
    for(int i = 0;i<10;i++){
      for(char ch = 'a';ch <= 'z';ch++){
        s.add(new Bigram(ch,ch));
      }
    }
    System.out.println(s.size());
  }
}

equals没有被覆盖，而是被重载，，为了覆盖Object.equals，必须定义一个参数为Object类型的equals方法，在这个例子中，Bigram是继承了equals方法

@Override
public boolean equals(Object o){
  if(!(o instanceof Bigram))
    return false;
  Bigram b = (Bigram)o;
  return b.first == first && b.second == second;
}

应该要在你想要覆盖超类声明的每个方法声明中使用Override注解

用标记接口定义类型（markerInterfacfe）
- 标记接口是没有包含方法声明的接口，而只是指明一个类实现了具有某种属性的接口
- 标记接口定义的类型是由被标记类的实例实现的；标记注解则没有定义这样的类型。
- 标记接口胜过标记注解的另一个优点是，它们可以被更加精确地锁定。如果注解类型利用@Target(ElementType.TYPE)声明，它就可以被应用到任何类或者接口。假设有一个标记只适用于特殊接口的实现。如果将它定义成一个标记接口，就可以用它将唯一的接口扩展成它适用的接口。
- 标记注解胜过标记接口最大的优点在于，他可以通过默认的方式添加一个或多个注解类型元素，给已被使用的注解类型添加更多的信息，随着时间的推移，简单的标记注解类型可以演变成更加丰富的注解类型
- 什么时候使用标记注解，什么时候应该使用标记接口呢？
  - 如果标记是应用到任何程序元素而不是类或者接口，就必须使用注解，因为只有类和接口可以用来实现或者拓展接口
  - 如果标记只应用给类和接口，就要思考编写一个还是多个只接受有这种标记的方法，如果是这种情况，就应该优先使用标记接口而非注解，这样就可以用接口作为相关方法的参数类型

foresight

泛型Generic

不要在新代码中使用原生态类型

声明中具有一个或多个typeParameter的类或者接口，就是泛型类或者接口。例如List<E>
每种泛型定义一组参数化的类型，格式为：先是类或者接口的名称，接着用<>把对应于泛型形式类型的时机类型参数列表扩起来，例如List<String>其中String是与形式类型参数E相对应的实际类型参数
每个泛型都定义一个原生态类型rawType，即不带任何实际类型参数的泛型名称，例如List<E>

//java1.5之前
private final Collection stamps = ...;
stamps.add(new Coin(...));//仍然不报错
//直到从stamp集合获取coin时才会收到错误提示
for(Iterator i = stamps.iterator();i.hasNext();){
  Stamp s =(Stamp) i.next();//这里Throws ClassCastException
}

有了泛型之后，就可以直接声明

//直接声明，告诉编译器放的Stamp
private final Collection<Stamp> stamps = ...;

使用List这样的原生态类型，会失掉类型安全性，但是如果使用像List<Object>则不会

//fails at runtime
public static void main(String[] args){
  List<String> strings = new ArrayList<String>();
  unsafeAdd(strings,new integer(42));
  String s = strings.get(0);
}

private static void unsafeAdd(List list,Object o){
  list.add(o)//warning
}

//可用这种方式编写
//但他使用了原生态类型
static int numElementsInCommon(Set s1,Set s2){
  int result = 0;
  for(Object 01:s1)
    if(s2.contains(01))
      result++;
  return result;
}

无限制的通配符类型，如果要使用泛型但不确定或者不关心实际的类型参数，就可以使用一个问号代替

//Set<E>的无限制通配符类型为Set<?>

//这样做是安全的
static int numElementsInCommon(Set<?> s1,Set<?> s2){
  int result = 0;
  for(Object o1:s1)
    if(s2.contains(o1))
      result++;
  return result;
}

消除非受检警告

foresight

类和接口（二）

接口优于抽象类

现有的类可以很容易被更新，以实现新的接口
接口是定义mixin的理想选择
接口允许我们构造非层次结构的类型框架
- ```
//歌手和作曲家
public interface Singer{...}
public interface SongWriter{...}

//可能既是歌手又是作曲家
public interface SingerSongWriter extends Singer,SongWriter{...}
```
- 若不这么做，可以对每一种都编写一个单独的类，如果整个系统有n个属性，那么有2^n钟可能的组合，被称为“组合爆炸”

对你导出的每一个重要接口都提供一个抽象的骨架实现类(skeletal implementation)，把接口和抽象类的优点结合起来,接口不允许方法的实现，但是用接口定义类型不妨碍为程序员的实现提供帮助

骨架实现

static List<Integer> intArrayAsList(final int[] a){
  if(a==null)
    throw new NullPointerException();
  
  return new AbstractiList<Lnteger>(){
    
    public Integer get(int i){
      return a[i];
    }
    
    @override
    public Integer set(int i,Integer val){
      int oldVal = a[i];
      a[i] = val;
      return oldVal;
    }
    
    public int size(){
      return a.length;
    }
  };
}

接口只用于定义类型

常量接口(constant interface),这种接口没有包含任何方法，只包含静态final域，每个域都导出一个常量，使用这些常量的类实现这个接口，以避免用类名来修饰常量

public interface PhysicalConstants{
  static final double AVOGADROS_NUMBER = 6.022;
  static final double BOLTZMANN_CONSTANT = 1.380;
  static final double ELECTRON_MASS = 9.109;
}

常量接口模式是对接口的不良使用，如果要导出常量

public class PhysicalConstants{
  private PhysicalConstants(){}
  public static final AVOGADROS_NUMBER = 6.022;
  public static final double BOLTZMANN_CONSTANT = 1.380;
  public static final double ELECTRON_MASS = 9.109;
}

//使用
PhysicalContants.AVOGADROS_NUMBER

//静态导入机制
import static ....PhysicalConstants.*;

public class Test{
  double atoms(double mols){
    //不用加类名
    return AVOGADROS_NUMBER * mols;
  }
  ...
}

类层次优于标签类

为标签类的每个方法定义一个抽象类，每个方法的行为都依附于标签值

//抽象类
abstract class Figure{
  abstract double area();
}
class Circle entends Figure{
  final double redius;
  
  Circle(double redius){this.radius = redius;}
  
  double area(){return Math.PI*(radius * radius);}
}
class Rectangle entends Figure{
  final double length;
  final double width;
  
  Rectangle(double length,double width){
    this.length = length;
    this.width = width;
  }
  
  double area(){return length*width;}
}

//use
class Square entends Rectangle{
  Square(double side){
    super(side,side);
  }
}

用函数对象表示策略
优先考虑静态成员类
- 嵌套类：被定义在另一个类的内部的类
  - 嵌套类的存在是为它的外围类提供服务
  - 如果嵌套类将来可能用于其他某个环境中，它就是顶层类
  - 嵌套类有四种：静态成员类、非静态成员类、匿名类、局部类（除第一种之外，其他的三种都被称为内部类）
- 静态成员类是最简单的一种嵌套类，可以被看作普通类被声明在另一个类的内部而已；静态成员类的一种常见方法是作为公有类的辅助类，仅当与它的外部类一起使用时才有意义
- 如果嵌套类的实例可以在它的外围类的实例之外独立存在，这个嵌套类就必须是静态成员类；在没有外围实例的情况下，要想创建非静态成员类的实例是不可能的
- 非静态成员类的一种常见用法是定义一个Adapter，它允许外部类的实例被看作是另一个不相关的类的实例
```
public class Myset<E> extends AbstractSet<E>{
  
  public Iterator<E> iterator(){
    return new MyIterator();
  }
  
  //非静态成员类的使用
  private class MyIterator implements Iterator<E> {
    ...
  }
}
```
  - 如果声明成员类不要求访问外围实例，就始终把static修饰符放在它的声明中，在静态和非静态之间做出选择是非常重要的
- 匿名类
  - 常见用法：动态创建函数对象、创建过程对象processObject、在静态工厂方法的内部
  - 除了在它们被声明的时候之外，是无法将他们实例化的，不能执行instanceof测试
  - 做任何需要命名类的其他事情，无法声明一个匿名类来实现多个接口，或者扩展一个类并同时扩展类和实现接口
- 局部类
  - 在任何可以声明局部变量的地方可以声明局部类，并且局部类也遵守同样的作用域规则
  - - 与成员类一样，局部类有名字，可以被重复使用
    - 与匿名类一样，只有当局部类是在非静态环境中定义的时候，才有外围实例，它们也不能包含静态成员

foresight

类和接口（一）

使类和成员的可访问性最小化

信息隐藏（封装）是软件设计的基本原则之一，设计良好的模块会隐藏其所有实现模块
第一规则：尽可能使每个类或成员不被外界访问
- 可访问性递增：private、package-private、protected、public

//potential security hole
//长度非零的数组总是可变的
public static final Thing[] VALUES = {...};

//第一种修正方法：
private static final Thing[] PRIVATE_VALUES = {...};//将不可变数组变为私有
public static final List<Thing> VALUES = 
  Collections.unmodefiableList(Arrays.asList(PRIVATE_VALUES));//复制增加一个公有不可变列表

//第二种修正方法：
//数组变成私有，增加一个公有方法，返回私有数组的拷贝
private static final Thing[] PRIVATE_VALUES = {...};
public static final Thing[] values{
  return PRIVATE_VALUES.clone();
}

总而言之，就是降低内部的可访问性

在公有类中使用访问方法而非公有域
- 对于可变类来说，应该用包含私有域和公有getter和setter方法来代替
使可变性最小化
- 不可变类是实例不能被修改的类，每个实例所包含的信息都必须在创建该实例的时候就提供，在lifetie内不变，包括String、BigInteger、BigDecimal
- 不可变类的规则：
  - 不要提供mutator
  - 保证类不会被扩展，防止子类化一般用final直接修饰
- 使所有域都是final的
- 使所有的域都是私有的
- 确保对于任何可变组件的互斥访问，尽量使用保护性拷贝方案

//eg.复数类

public final class Complex{
  private final double re;
  private final double im;
  
  public Complex(double re,double im){
    this.re = re;
    this.im = im;
  }
  
  //no corresponding mutators
  public double realPart(){return re;}
  public double imaginaryPart(){return im;}
  
  //计算方法
  public Complex add(Complex c){
    return new Complex(re + c.re,im+c.im);
  }
  public Complex subtract(...){...}
  public Complex divide(...){...}
  public Complex multiply(...){...}
  
  //override
  @Override
  public boolean equals(Object o){
    if(o == this) return true;
    if(!(o instanceof Complex)) return false;
    Complex c = (Complex) o;
    
    return Double.compare(re.c.re) == 0 &&
      Double.compare(imm,c.im) == 0;
  }
  @override
  public in hashCode(){
    int result = 17 + hashDouble(re);
    result = 31*result + hashDouble(im);
    return result;
  }
  @override public String toStrong(){
    return "(" + re + "+" + im + "i)"
  }
}

在算数运算中返回新的Complex实例，而不是修改这个实例，称为functional做法
不可变对象可以被自由的共享
不可变对象真正唯一的缺点是：对于每个不同的值都需要一个单独的对象

不可变类除了final修饰之外，还有让类的所有构造器都变成私有的或者包级私有的，并添加公有的静态工厂

public class Complex{
  private final double re;
  private final double im;
  
  private Complex(double re,double im){
    this.re = re;
    this.im = im;
  }
  
  public static Complex valueOf(double re,double im){
    return new Complex(re,im);
  }
  
  ...//Remainder unchanged
}

//例如基于极坐标创建复数的静态方法
//只需添加静态工厂，其名称可以直接的反应其功能
public static Complex valueOfPolar(double r,double theta){
  return new Complex(r * Math.cos(theta),r * Math.sin(theta));
}

复合优先于继承
- 一般好的方法是覆盖时直接重写该方法
- - 复合：不用扩展现有的类，直接在新的类中增加一个私有域，引用现有的类的实例
  - 转发：新类中的每个实例方法都可以调用被包含的现有的类实例中对应的方法，并返回他的结果，这被称为转发

要么为继承而设计，并提供文档说明，要么就禁止继承

构造器绝不能调用可被override的方法

//构造器调用了可被覆盖的方法
public class Super{
  public Super(){
    overrideMe();
  }
  
  public void overrideMe(){
    ...
  }
}

下面的子类覆盖了方法overrideMe,Super唯一的构造器就调用了这个方法

public final class Sub extends Super{
  private final Dta data;
  
  Sub(){
    data = new Data();
  }
  
  @Override
  public void overrideMe(){
    ...
  }
  
  public static void main(String[] args){
    Sub sub = new Sub();
    sub.overrideMe();
  }
}

/*
第一次打印出null，override被Super构造器调用的时候，构造器Sub还没有机会初始化data域
第二次打印出时间
*/

如果必须继承，合理的方法就是确保这个类不会调用它的任何可覆盖的方法（完全消除这个类中可覆盖方法的自用特性）

foresight

创建和销毁对象

遇到多个构造器参数时要考虑用构建器：

javaBean模式，无参构造器+setter方法
Object.freeze()方法，被冻结的对象不能修改、添加、删除其属性或者属性值

Builder模式

public class NutritionFacts{
  private final int servingSize;
  private final int fat;
  
  public static class Builder{
    //Reqiired parameters
    private final int servingSize;
    //default
    private int fat = 0;
    
    public Builder(int servingSzie){
      this.servingSzie = servingSize;
    }
    
    public Builder fat(int fat){
      this.fat = fat;
    }
    
    public NutritionFacts build(){
      return new NutritionFacts(this);
    }
  }
  private NutritionFacts(Builder builder){
    servingSize = builder.servingSize;
    fat = builder.fat;
  }
}

//构造
NutritionFacts cola = new NutritionFacts.Builder(240).fat(35).build();

用私有构造器或者枚举类型强化Singleton属性(指仅仅被实例化一次的类)

//公有的静态成员
//缺少公有的或者受保护的构造器，且私有构造器仅仅被调用一次，保证了Elvis的全局唯一性
public class Elvis{
  public static final Elvis INSTANCE = new Elvis();
  private Elvis(){...}
  
  public void leaveTheBuilding(){...}
}

//公有的成员是个静态工厂方法
//调用getInstance都会返回同一个对象引用
public class Elvis{
  private static final Elvis INSTANNCE = new Elvis();
  private Elvis(){...}
  public static Elvis getInstance{return INSTANCE;}
  
  public void leaveTheBuilding(){...}
}

//Enum singleton 包含单个元素的枚举类型
//与公有域方法大致相同，但更加简洁
public enum Elvis{
  INSTANCE;
 
  public void leaveTheBuilding(){...}
}

通过私有构造器强化不可实例化能力

工具化类不希望被实例化，类似于编写过程化语言

public class UtilityClass{
  //default constryctor for noninstantiability
  //构造器私有就能保证不能被实例化
  private UtilityClass(){
    throw new AssertionError();
  }
  
  ...
}

避免创建不必要的对象

//重复构造
String s = new String("test");	
//对同一台虚拟机中运行的代码，包含相同的字面常量，该对象就会被重用
String s = "test";

//重用不可变对象
//eg.判断是否是生育高峰出生
class person{
  private static final Data BIRTH_DATA;//出生日期
  private static final Data BOOM_START;//生育高峰
  private static final Data BOOM_END;//生育高峰结束
  
  //避免每一次调用判断方法都创建Calendar对象
  static{
    Calendar gmetCal = 
      Calendar.getInstance(TimdeZone.getTimeZone("GMT"));
    gmtCal.set(...);//设置开始时间
    BOOM_START = gmtCal.getTime();
    gmtCal.set(...);//结束时间
    BOOM_START = gmtCal.getTime();
  }
  
  public boolean isBabyBoomer(){
    return BIRTH_DATA.compareTo(BOOM_START) >=0&&
      BIRTH_DATA.compareTo(BOOM_END) <=0;
  }
}

对象池

消除过期的对象引用
- 对象数组中，element[index] = null,使对象被回收
- 缓存导致的内存泄漏
- 监听器和其他回调

避免使用终结方法finalizer

finalize()方法是Object类中提供的一个方法，在GC准备释放对象所占用的内存空间之前，它将首先调用finalize()方法。

//调用时机不确定，导致性能的降低
class User{
	public static User user = null;

	@Override
	protected void finalize() throws Throwable {
		System.out.println("User-->finalize()");
		user = this;
	}
	
}

public class FinalizerTest {
	public static void main(String[] args) throws InterruptedException {
		User user = new User();
		user = null;
		System.gc();
		Thread.sleep(1000);
		
		user = User.user;
		System.out.println(user != null);//true
		
		user = null;
		System.gc();
		Thread.sleep(1000);
		System.out.println(user != null);//false
	}
}

foresight

JAVA基础巩固
参考《effectiveJava》、《如何像计算机学家一样思考Java》、runoob.com、google等

foresight

孤立森林

概述

孤立森林是用于异常检测的机器学习算法。这是一种无监督学习算法，通过隔离数据中的离群值识别异常。

基本思想

孤立森林是基于决策树的算法。从给定的特征集合中随机选择特征，然后在特征的最大值和最小值间随机选择一个分割值，来隔离离群值。这种特征的随机划分会使异常数据点在树中生成的路径更短，从而将它们和其他数据分开。

原理

孤立森林的原理是：异常值是少量且不同的观测值，因此更易于识别。孤立森林集成了孤立树，在给定的数据点中隔离异常值。
孤立森林通过随机选择特征，然后随机选择特征的分割值，递归地生成数据集的分区。和数据集中「正常」的点相比，要隔离的异常值所需的随机分区更少，因此异常值是树中路径更短的点，路径长度是从根节点经过的边数。

优势

用孤立森林，不仅可以更快地检测异常，还需要更少的内存。
孤立森林隔离数据点中的异常值，而不是分析正常的数据点。和其他正常的数据点相比，异常数据点的树路径更短，因此在孤立森林中的树不需要太大的深度，所以可以用更小的 max_depth 值，从而降低内存需求。

定义与拟合模型

我们要创建一个模型变量，并实例化 IsolationForest（孤立森林）类。将这四个参数的值传递到孤立森林方法中，如下所示。

评估器数量：n_estimators 表示集成的基评估器或树的数量，即孤立森林中树的数量。
最大样本：max_samples 是训练每个基评估器的样本的数量。如果 max_samples 比样本量更大，那么会用所用样本训练所有树。
数据污染问题：算法对这个参数非常敏感，它指的是数据集中离群值的期望比例，根据样本得分拟合定义阈值时使用。
最大特征：所有基评估器都不是用数据集中所有特征训练的。这是从所有特征中提出的、用于训练每个基评估器或树的特征数量。

import numpy as np
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
from sklearn.ensemble import IsolationForest

df = pd.read_csv('salary.csv')
df.head(len(df))

model=IsolationForest(n_estimators=100,
                      max_samples='auto', 
                      contamination='auto',# 
                      max_features=1.0)
model.fit(df[['salary']])

df['scores']=model.decision_function(df[['salary']])
df['anomaly']=model.predict(df[['salary']])
df.head(len(df))

anomaly=df.loc[df['anomaly']==-1]
anomaly_index=list(anomaly.index)
print(anomaly)
print(anomaly_index)

outliers_counter = len(df[df['salary'] > 9999999])
outliers_counter

print("Accuracy percentage:", 100*list(df['anomaly']).count(-1)/(outliers_counter))

foresight

随机森林RandomForest

基本思想

随机森林的结果是依赖于多棵决策树的结果，这是一种集成学习的思想
随机思想：随机选取一定数量的特征（需调参），再从中选取最优的几组特征（GINI、熵、OOB）
票选的思想：最终的结果是多棵决策树票选的结果

基本步骤

随机抽样训练决策树（选取最优的几组决策树）
随机选取属性做节点分裂属性（选取最优的几组属性）
重复步骤2，直到不能再分裂
建立大量决策树，形成森林

GINI指数（评估特征的重要性）

用随机森林进行特征重要性评估的思想其实很简单，说白了就是看看每个特征在随机森林中的每颗树上做了多大的贡献，然后取个平均值，最后比一比特征之间的贡献大小。
Gini指数越小表示集合中被选中的样本被分错的概率越小，也就是说集合的纯度越高，反之，集合越不纯。
Gini = 1 – Σ (Pi)2 for i=1 to number of classes(pi is squared probabilities of each class)

  # 计算GINI，gini表示不纯度，越小越纯，越大越不纯
  def calGini(dataSet):
      # 创建字典，统计该数据集中的各个标签的数量
      lables = calculateDiffCount(dataSet)
      # 计算gini
      length = len(dataSet)
      gini = 1.0
      for key in lables.keys():
          gini -= (lables[key]/length)**2
      return gini

实现（基于GINI指数,Pima数据集）

Pima印第安人数据集
【1】Pregnancies：怀孕次数
【2】Glucose：葡萄糖
【3】BloodPressure：血压 (mm Hg)
【4】SkinThickness：皮层厚度 (mm)
【5】Insulin：胰岛素 2小时血清胰岛素（mu U / ml
【6】BMI：体重指数（体重/身高）^2
【7】DiabetesPedigreeFunction：糖尿病谱系功能
【8】Age：年龄（岁）
【9】Outcome：类标变量（0或1）

6	148	72	35	0	33.6	0.627	50	1
1	85	66	29	0	26.6	0.351	31	0
8	183	64	0	0	23.3	0.672	32	1
1	89	66	23	94	28.1	0.167	21	0
0	137	40	35	168	43.1	2.288	33	1
5	116	74	0	0	25.6	0.201	30	0
3	78	50	32	88	31	0.248	26	1
......

导入库

import numpy as np
import random
# 一个是随机选取样本，一个是随机选取特征
# 决策树的个数、特征属性的个数、递归次数（即决策树的深度）

构建决策树部分

# 决策树部分

# 计算GINI，gini表示不纯度，越小越纯，越大越不纯
def calGini(dataSet):
    # 创建字典，统计该数据集中的各个标签的数量
    lables = calculateDiffCount(dataSet)
    # 计算gini
    length = len(dataSet)
    gini = 1.0
    for key in lables.keys():
        gini -= (lables[key]/length)**2
    return gini

# 对数据集dataSet，对于第col列特征，根据value划分为两个数据集
def splitData(dataSet,col,value):
    data1 = []
    data2 = []
    for line in dataSet:
        if(line[col] >= value):
            data1.append(line)
        else:
            data2.append(line)
    return data1,data2

# 数标签
def calculateDiffCount(datas):
    results = {}
    for data in datas:
        if data[-1] not in results:
            results[data[-1]] = 1
        else:
            results[data[-1]] += 1
    return results


# 递归调用，选取最佳的特征和最佳特征当中的最佳分割值
def BuildCartDecisionTree(dataSet,features,maxDepth,depth):
    
    if(depth >= maxDepth):
        return calculateDiffCount(dataSet)
    
    depth+=1
    
    # 目前的gini
    currentgini = calGini(dataSet)
    # 列数
    column_length = len(dataSet[0])
    # 行数（样本数）
    rows_length = len(dataSet)
    
    # giniIndex的差
    best_gini_gain = 0.0
    
    best_value = None
    best_set = None
    
    for col in features:
        values = set([x[col] for x in dataSet])
        for value in values:
            data1,data2 = splitData(dataSet,col,value)
            p = len(data1)/rows_length
            gini = p*calGini(data1)+(1-p)*calGini(data2)
            gain = currentgini-gini
            if(gain > best_gini_gain):
                best_gini_gain = gain
                best_value = (col,value)
                best_set = (data1,data2)
                

    if(best_gini_gain > 0.0):
        trueBranch = BuildCartDecisionTree(best_set[0], features,maxDepth,depth)
        falseBranch = BuildCartDecisionTree(best_set[1], features,maxDepth,depth)
        return (best_value[0],
                best_value[1],
                falseBranch,
                trueBranch)
    else:
        return calculateDiffCount(dataSet)

随机取特征

def getFeatures(dataSet,n_features):
    return random.sample(range(len(dataSet[0])-1),n_features)

导入数据

def loadData():
#     dataMat = []; labelMat = []
    alldataMat = []
    pima = open("../Pima.csv")
    for line in pima:
        lineArr = line.strip().split(',')
        float_map = map(float,lineArr)
        float_list = list(float_map)
#         dataMat.append(float_list[0:-1])
#         labelMat.append(int(lineArr[-1]))
        float_list[-1] = int(lineArr[-1])
        alldataMat.append(float_list)
    return alldataMat

切分数据集

# 切分数据集，以便交叉验证
# input(数据集，个数)
def spiltDataSet(dataSet,bag_nums):
    spiltedDataSet = []
    oneBagLength = int(len(dataSet)/bag_nums)
    data = []
    for index in random.sample(range(len(dataSet)),len(dataSet)):
        if(len(data) < oneBagLength):
            data.append(dataSet[index])
        else:
            spiltedDataSet.append(data)
            data = []
    return spiltedDataSet

建立森林

# 树的个数，随机选取的特征数，树的最大深度，随机分成的数据集的个数
def buildRandomForest(n_trees,n_features,max_tree_depth,n_dataSets):
    RForest = []
    # 载入数据
    dataMat = loadData()
    # 随机分数据集
    spiltedDataSet = spiltDataSet(dataMat,n_dataSets)
    # 构建n_trees棵树的森林
    for i in range(n_trees):
        features = getFeatures(dataMat,n_features)
        tree = BuildCartDecisionTree(spiltedDataSet[random.randint(0,len(spiltedDataSet)-1)],features,max_tree_depth,1)
        RForest.append(tree)
    return RForest

基于决策树分类数据

def classifyByTree(tree,data):
    lengthOfNode = len(tree)
    if(lengthOfNode == 4):
        feature = tree[0]
        value = tree[1]
        data_value = data[feature]
        if(data_value >= value):
            return classifyByTree(tree[3],data)
        else:
            return classifyByTree(tree[2],data)
    else:
        return max(tree,key=tree.get)

基于森林分类（票选）

def classifyByForest(forest,data):
    results = {}
    for tree in forest:
        result = classifyByTree(tree,data)
        if result not in results:
            results[result] = 1
        else:
            results[result] += 1
    return max(results,key=results.get)

计算准确度

def acc():
    forest = buildRandomForest(200,3,10,5)
    dataMat = loadData()
    count = 0
    for index in random.sample(range(len(dataMat)),len(dataMat)-1):
        result = classifyByForest(forest,dataMat[index])
        if(result == dataMat[index][-1]):
            count += 1
    return float(count/len(dataMat))

参考:
1.通俗易懂图示剖析随机森林 https://blog.csdn.net/cg896406166/article/details/83796557
2.Gini重要性评估 https://blog.csdn.net/zjuPeco/article/details/77371645
3.票选带图示 https://www.sohu.com/a/234722514_787107
4.票选 https://blog.csdn.net/zjuPeco/article/details/77371645
5.GINI阿里实战：用Python实现随机森林 https://baijiahao.baidu.com/s?id=1621066120041839448&wfr=spider&for=pc
6.IForesthttps://scikit-learn.org/stable/modules/generated/sklearn.ensemble.IsolationForest.html
7.RForesthttps://scikit-learn.org/stable/modules/generated/sklearn.ensemble.RandomForestClassifier.html
8.一文看懂RF https://easyai.tech/ai-definition/random-forest/

foresight

MachineLearning入门初识

参考Google developer https://developers.google.cn/machine-learning/crash-course
参考《机器学习实战》

什么是（监督式）机器学习？

机器学习系统通过学习如何组合输入信息来对从未见过的数据做出有用的预测

特征

特征是输入变量，即简单线性回归中的 x 变量。简单的机器学习项目可能会使用单个特征，而比较复杂的机器学习项目可能会使用数百万个特征

样本

样本是指数据的特定实例：
- 有标签样本
- 无标签样本
- - **我们使用有标签样本来训练模型。**在垃圾邮件检测器中，有标签样本是用户明确标记为“垃圾邮件”或“非垃圾邮件”的各个电子邮件。
  - **在使用有标签样本训练模型之后，我们会使用该模型预测无标签样本的标签。**在垃圾邮件检测器示例中，无标签样本是用户尚未添加标签的新电子邮件。
- labeled examples: {features, label}: (x, y) 有特征和标签
  - 例如房子的大小，房型，房间数；而房价则可称为标签；
- unlabeled examples: {features, ?}: (x, ?) 有特征而无标签
  - 房子大小房型知道，房价未知
个人理解：标签是更为主观的判断

模型

模型定义了特征与标签之间的关系。
训练是指创建或学习模型。也就是说，向模型展示有标签样本，让模型逐渐学习特征与标签之间的关系。
推断是指将训练后的模型应用于无标签样本。也就是说，使用经过训练的模型做出有用的预测 (y')。例如，在推断期间，您可以针对新的无标签样本预测 medianHouseValue.（即由房型，大小，房间数推断价格）

回归与分类

回归模型可预测连续值。例如，回归模型做出的预测可回答如下问题：
- 加利福尼亚州一栋房产的价值是多少？
- 用户点击此广告的概率是多少？
分类模型可预测离散值。例如，分类模型做出的预测可回答如下问题：
- 某个指定电子邮件是垃圾邮件还是非垃圾邮件？
- 这是一张狗、猫还是仓鼠图片？

线性回归

即可简单的写出模型方程式

训练与损失

平方损失：一种常见的损失函数

= the square of the difference between the label and the prediction
= (observation - prediction(x))2
= (y - y')2

均方误差 (MSE)

指的是每个样本的平均平方损失。要计算 MSE，请求出各个样本的所有平方损失之和，然后除以样本数量。

迭代方法

hot and cold 游戏
- 初始值
- 计算损失
- “计算参数更新”部分，机器学习系统就是在此部分检查损失函数的值，并为和生成新值。
- 学习过程会持续迭代，直到该算法发现损失可能最低的模型参数
- 不断迭代，直到总体损失不再变化或至少变化极其缓慢为止。这时候，我们可以说该模型已收敛。

梯度下降法

梯度

函数的梯度是偏导数相对于所有自变量的矢量
- z = f(x,y) 就像一个山谷，最低点为 (2,0,4)：的梯度是一个二维矢量，可让您了解向哪个 (x,y) 方向移动时高度下降得最快。也就是说，梯度矢量指向山谷。
- 梯度是矢量：具有大小和方向
- 在机器学习中，梯度用于梯度下降法。我们的损失函数通常具有很多变量，而我们尝试通过跟随函数梯度的负方向来尽量降低损失函数。

学习速率

每个回归问题都存在一个金发姑娘学习速率。“金发姑娘”值与损失函数的平坦程度相关。
学习速率过大：如果您知道损失函数的梯度较小，则可以放心地试着采用更大的学习速率，以补偿较小的梯度并获得更大的步长。
学习速率过小花费更多时间

优化学习速率

playground>>>https://developers.google.cn/machine-learning/crash-course/fitter/graph

随机梯度下降法

通过从我们的数据集中随机选择样本，我们可以通过小得多的数据集估算（尽管过程非常杂乱）出较大的平均值。随机梯度下降法 (SGD) 将这种想法运用到极致，它每次迭代只使用一个样本（批量大小为 1）。如果进行足够的迭代，SGD 也可以发挥作用，但过程会非常杂乱。
批量指的是用于在单次迭代中计算梯度的样本总数
批量大小越大，出现冗余的可能性就越高。一些冗余可能有助于消除杂乱的梯度，但超大批量所具备的预测价值往往并不比大型批量高。
“随机”这一术语表示构成各个批量的一个样本都是随机选择的。

Playground

playground>>>http://playground.tensorflow.org/

foresight

决策树算法

1. 简单概括

利用熵将整个数据集进行分割

使得分割后数据集的熵最小

不断对子数据集进行递归

直至无法进一步分割或者子数据集里数据的标签都一致时递归结束

分割的过程会形成一棵决策树

利用决策树将输入的数据归类到某一分割后的数据集中

子数据集所带有的标签就是决策的结果

2. 熵的定义和实现

熵定义为信息的期望值

信息的计算公式为
$l(x_i) = -log_2p(x_i) \quad$
其中 $p(x_i)$ 是选择某一分类的概率
信息的期望值为
$H = -\sum_{i=1}^n p(x_i)log_2p(x_i)$

核心代码

def calcShannon(dataSet):
    dataSetSize = len(dataSet)
    result = {}
    # 利用字典统计每一种标签的数据数量
    for data in dataSet:
        label = data[-1]
        result[label] = result.get(label, 0) + 1
    shannon = 0
    # 对于每一种分类计算其概率并统计信息熵
    for key in result:
        prob = result[key]/dataSetSize
        shannon -= prob * math.log(prob, 2)
    return shannon

3. 分割数据集

# 分割数据集，将维度axis且值为value的数据单独提取出来
def splitDataSet(dataSet, axis, value):
    result = []
    for data in dataSet:
        if data[axis] == value:
            # 使用axis分割后将axis这一列从数据中去掉
            tmp = data[:axis]
            # 这里通过entend拼接数组跳过了axis这一列
            tmp.extend(data[axis+1:])
            result.append(tmp)
    return result

4. 选择最好的分割维度

def chooseBestSplitAxis(dataSet):
    numOfAxis = len(dataSet[0]) - 1
    baseEntropy = calcShannon(dataSet)
    bestInfoGain = 0.0
    bestAxis = -1
    # 对所有维度都循环试验
    for axis in range(numOfAxis):
        allValue = [x[axis] for x in dataSet]
        # 维度下所有可能的不重复值
        valueSet = set(allValue)
        newEntropy = 0.0
        for value in valueSet:
            # 按不重复的值分割成子数据集
            subDataSet = splitDataSet(dataSet, axis, value)
            prob = float(len(subDataSet)) / float(len(dataSet))
            # 新的熵为部分熵按比例求和
            newEntropy += prob * calcShannon(subDataSet)
        # 作差为正说明新熵比旧熵小，混乱程度减小
        # newInfoGain = baseEntropy - newEntropy
        # if newInfoGain > bestInfoGain:
            # bestAxis = axis
            # bestInfoGain = newInfoGain
        if newEntropy < baseEntropy:
            # 上面源码有点绕 简单理解就是熵变小了就选择
            bestAxis = axis
    return bestAxis

5. 生成决策树

def createTree(dataSet, labels):
    labelList = [data[-1] for data in dataSet]
    # 递归出口一：子数据集的标签已经统一只有一种，不需要再进一步分割
    if labelList.count(labelList[0]) == len(labelList):
        return labelList[0]
    # 递归出口二：子数据集已经没有了可分割的维度只剩下了标签
    if len(dataSet[0]) == 1:
        # 统计子数据集中出现次数最多的标签即为决策结果
        return voteMaxLabel(labelList)
    # 选择熵最小的分割维度
    bestAxis = chooseBestSplitAxis(dataSet)
    bestLabel = labels[bestAxis]
    # 建立决策树字典
    myTree = {bestLabel: {}}
    # 删除已用于分割的维度对应的标签
    del(labels[bestAxis])
    allValue = [x[bestAxis] for x in dataSet]
    valueSet = set(allValue)
    for value in valueSet:
        # 复制一遍标签
        subLabel = labels[:]
        # 采用最好的分割方法分割数据集后递归生成子树
        myTree[bestLabel][value] = createTree(splitDataSet(dataSet, bestAxis, value), subLabel)
    return myTree

6. 利用决策树进行决策

决策树生成范例

{'flippers': {0: 'no', 1: {'no surfacing': {0: 'no', 1: 'yes'}}}}

其中每一次决策需要用到决策树的两层

以这里的决策树为例

第一层‘flippers’为进行决策的标签

第二层的0和1为在该标签下进行决策的不同选择
核心代码

def classifyByTree(tree, labels, data):
    # 得到进行决策的标签
    firstLabel = list(tree.keys())[0]
    # 用该标签进行决策的子树
    secondDict = tree[firstLabel]
    # 得到用于决策的标签所属的维度，用于后面取出数据在该维度的值
    firstLabelIndex = labels.index(firstLabel)
    classLabel = 'Error'
    # 对于该标签下进行决策的不同的值
    for value in secondDict.keys():
        # 如果数据在该决策标签维度下的值等于子树的决策值
        if data[firstLabelIndex] == value:
            # 如果子树下还有子树（即还是一个字典类型的数据）则继续进行决策
            if type(secondDict[value]).__name__ == 'dict':
                classLabel = classifyByTree(secondDict[value], labels, data)
            else:
                # 否则子树下的值就是决策的结果
                classLabel = secondDict[value]
    return classLabel

foresight

记得第一次接触是雷博士的技术分享，学到了！！！

foresight

Context

Context是维持Android程序中各组件能够正常工作的一个核心功能类。
弹出Toast、启动Activity、启动Service、发送广播、操作数据库等等都需要用到Context。

  TextView tv = new TextView(getContext());

  ListAdapter adapter = new SimpleCursorAdapter(getApplicationContext(), ...);

  AudioManager am = (AudioManager) getContext().getSystemService(Context.AUDIO_SERVICE);getApplicationContext().getSharedPreferences(name, mode);

  getApplicationContext().getContentResolver().query(uri, ...);

  getContext().getResources().getDisplayMetrics().widthPixels * 5 / 8;

  getContext().startActivity(intent);

  getContext().startService(intent);

  getContext().sendBroadcast(intent);

Bundle savedInstanceState

onCreate方法的完整定义如下:

  public void onCreate(Bundle savedInstanceState){
  super.onCreate(savedInstanceState);
  }

从上面的代码可以看出，onCreate方法的参数是一个Bundle类型的参数。Bundle类型的数据与Map类型的数据相似，都是以key-value的形式存储数据的。
从字面上看savedInstanceState，是保存实例状态的。实际上，savedInstanceState也就是保存Activity的状态的
eg. SnakeView in SnakeGame :

  private int[] coordArrayListToArray(ArrayListcvec) {
          int count = cvec.size();
          int[] rawArray = new int[count * 2];
          for (int index = 0; index < count; index++) {
              Coordinate c = cvec.get(index);
              rawArray[2 * index] = c.x;
              rawArray[2 * index + 1] = c.y;
          }
          return rawArray;
      }
      
      public Bundle saveState() {
          Bundle map = new Bundle();
          map.putIntArray("mAppleList", coordArrayListToArray(mAppleList));
          map.putInt("mDirection", Integer.valueOf(mDirection));
          map.putInt("mNextDirection", Integer.valueOf(mNextDirection));
          map.putLong("mMoveDelay", Long.valueOf(mMoveDelay));
          map.putLong("mScore", Long.valueOf(mScore));
          map.putIntArray("mSnakeTrail", coordArrayListToArray(mSnakeTrail));
          return map;
      }
  在snakeActivity中实现
  @Override
      public void onCreate(Bundle savedInstanceState) {
          super.onCreate(savedInstanceState);
          setContentView(R.layout.snake_layout);
          mSnakeView = (SnakeView) findViewById(R.id.snake);
          mSnakeView.setTextView((TextView) findViewById(R.id.text));
          if (savedInstanceState == null) {
              // We were just launched -- set up a new game
              mSnakeView.setMode(SnakeView.READY);
          } else {
              // We are being restored
              Bundle map = savedInstanceState.getBundle(ICICLE_KEY);
              if (map != null) {
                  mSnakeView.restoreState(map);
              } else {
                  mSnakeView.setMode(SnakeView.PAUSE);
              }
          }
      }
  并重写onSavedInstanceState（），此方法会在activity结束时，调用.
      @Override
      public void onSaveInstanceState(Bundle outState) {
          //Store the game state
          outState.putBundle(ICICLE_KEY, mSnakeView.saveState());
      }

foresight

Android基础学习笔记
复杂控件学习记录
参考《第一行代码（第二版）》、GoogleDeveloper等

foresight

kMeans初步实现-基于iris数据集

随机选择K个中心点
把每个数据点分配到离它最近的中心点
重新计算每类中的点到该类中心点距离的平均值
分配每个数据到它最近的中心点；
重复步骤3和4，直到所有的观测值不再被分配或是达到最大的迭代次数

import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
import random
import collections



# 载入数据
def loadData():
    iris = pd.read_csv("../iris.csv",header=None)
    k = len(iris[4].value_counts())
    lables = iris.iloc[:,4:].values.tolist()
    dataMat = np.array(iris.iloc[:,0:4].values.tolist())
    return k,dataMat,lables


# # 欧式距离
def distance(mat1,mat2):
    return np.sqrt(sum((mat1-mat2)**2))
# def distance(mat1,mat2):
#     diffMat = mat1 - mat2
#     sqDiffMat = diffMat**2
#     sqDistance = sqDiffMat.sum(axis = 1)
#     distance = sqDistance**0.5
#     return distance


def randomPoint(k,dataMat):
    randomPointList = random.sample(range(0,150), k)
    point = np.zeros( (k,4) )
    index = 0
    for i in randomPointList:
        point[index] = dataMat[i]
        index+=1
    return point,randomPointList

# 簇个数，数据集，最大迭代次数
def kMeans(maxTimes):
    # 载入数据
    k,dataMat,lables = loadData()
    # 数据集长度
    length = dataMat.shape[0]
    # 随机产生的最开始的点
    point,cPoints = randomPoint(k,dataMat)
    # 第一次分配
    classes = []
    for i in range(0,k):
        classes.append([])
    for i in range(0,length):
        if( i in cPoints):
            continue 
        distanceList = []
        for x in cPoints:
            distanceList.append(distance(dataMat[i],dataMat[x]))
            max_index = distanceList.index(min(distanceList))
        classes[max_index].append(i)
    
    
    # 迭代次数
    count = 0
    while(count < maxTimes):
        pointTemp = np.zeros( (k,4) )
        for i in range(0,3):
            for index in classes[i]:
                pointTemp[i] += dataMat[index]
            classlength = float(len(classes[i]))
            pointTemp[i]/=classlength
            
        classes = []
        for i in range(0,k):
            classes.append([])
            
        for i in range(0,length):
            distanceList = []
            for x in pointTemp:
                distanceList.append(distance(dataMat[i],x))
                max_index = distanceList.index(min(distanceList))
            classes[max_index].append(i)

            
        # 如果收敛
        if((pointTemp == point).all()):
            break
        else:
            point = pointTemp
            count+=1
            
            
            
    # 票选出最终结果
    result = []
    for i in range(0,3):
        frequency = {}
        for index in classes[i]:
            if lables[index][0] not in frequency:
                frequency[lables[index][0]] = 1
            else:
                frequency[lables[index][0]] += 1
        result.append(max(frequency,key=frequency.get))
    
    return result,count,classes,lables

def test(result,classes,k,lables):
    error = 0 
    for i in range(0,k):
        for index in classes[i]:
            if(lables[index][0] != result[i]):
                error+=1
    print(1-error/150.0)
    return

result,count,classes,lables = kMeans(20)

test(result,classes,3,lables)

iris数据集
Iris数据集是常用的分类实验数据集，由Fisher, 1936收集整理。Iris也称鸢尾花卉数据集，是一类多重变量分析的数据集。数据集包含150个数据样本，分为3类，每类50个数据，每个数据包含4个属性。可通过花萼长度，花萼宽度，花瓣长度，花瓣宽度4个属性预测鸢尾花卉属于（Setosa，Versicolour，Virginica）三个种类中的哪一类。

5.1	3.5	1.4	0.2	Iris-setosa
4.9	3.0	1.4	0.2	Iris-setosa
4.7	3.2	1.3	0.2	Iris-setosa
4.6	3.1	1.5	0.2	Iris-setosa
5.0	3.6	1.4	0.2	Iris-setosa
5.4	3.9	1.7	0.4	Iris-setosa
4.6	3.4	1.4	0.3	Iris-setosa
5.0	3.4	1.5	0.2	Iris-setosa
4.4	2.9	1.4	0.2	Iris-setosa
4.9	3.1	1.5	0.1	Iris-setosa
5.4	3.7	1.5	0.2	Iris-setosa
4.8	3.4	1.6	0.2	Iris-setosa
4.8	3.0	1.4	0.1	Iris-setosa
4.3	3.0	1.1	0.1	Iris-setosa
5.8	4.0	1.2	0.2	Iris-setosa
5.7	4.4	1.5	0.4	Iris-setosa
5.4	3.9	1.3	0.4	Iris-setosa
5.1	3.5	1.4	0.3	Iris-setosa
5.7	3.8	1.7	0.3	Iris-setosa
5.1	3.8	1.5	0.3	Iris-setosa
5.4	3.4	1.7	0.2	Iris-setosa
5.1	3.7	1.5	0.4	Iris-setosa
4.6	3.6	1.0	0.2	Iris-setosa
5.1	3.3	1.7	0.5	Iris-setosa
4.8	3.4	1.9	0.2	Iris-setosa
5.0	3.0	1.6	0.2	Iris-setosa
5.0	3.4	1.6	0.4	Iris-setosa
5.2	3.5	1.5	0.2	Iris-setosa
5.2	3.4	1.4	0.2	Iris-setosa
4.7	3.2	1.6	0.2	Iris-setosa
4.8	3.1	1.6	0.2	Iris-setosa
5.4	3.4	1.5	0.4	Iris-setosa
5.2	4.1	1.5	0.1	Iris-setosa
5.5	4.2	1.4	0.2	Iris-setosa
4.9	3.1	1.5	0.1	Iris-setosa
5.0	3.2	1.2	0.2	Iris-setosa
5.5	3.5	1.3	0.2	Iris-setosa
4.9	3.1	1.5	0.1	Iris-setosa
4.4	3.0	1.3	0.2	Iris-setosa
5.1	3.4	1.5	0.2	Iris-setosa
5.0	3.5	1.3	0.3	Iris-setosa
4.5	2.3	1.3	0.3	Iris-setosa
4.4	3.2	1.3	0.2	Iris-setosa
5.0	3.5	1.6	0.6	Iris-setosa
5.1	3.8	1.9	0.4	Iris-setosa
4.8	3.0	1.4	0.3	Iris-setosa
5.1	3.8	1.6	0.2	Iris-setosa
4.6	3.2	1.4	0.2	Iris-setosa
5.3	3.7	1.5	0.2	Iris-setosa
5.0	3.3	1.4	0.2	Iris-setosa
7.0	3.2	4.7	1.4	Iris-versicolor
6.4	3.2	4.5	1.5	Iris-versicolor
6.9	3.1	4.9	1.5	Iris-versicolor
5.5	2.3	4.0	1.3	Iris-versicolor
6.5	2.8	4.6	1.5	Iris-versicolor
5.7	2.8	4.5	1.3	Iris-versicolor
6.3	3.3	4.7	1.6	Iris-versicolor
4.9	2.4	3.3	1.0	Iris-versicolor
6.6	2.9	4.6	1.3	Iris-versicolor
5.2	2.7	3.9	1.4	Iris-versicolor
5.0	2.0	3.5	1.0	Iris-versicolor
5.9	3.0	4.2	1.5	Iris-versicolor
6.0	2.2	4.0	1.0	Iris-versicolor
6.1	2.9	4.7	1.4	Iris-versicolor
5.6	2.9	3.6	1.3	Iris-versicolor
6.7	3.1	4.4	1.4	Iris-versicolor
5.6	3.0	4.5	1.5	Iris-versicolor
5.8	2.7	4.1	1.0	Iris-versicolor
6.2	2.2	4.5	1.5	Iris-versicolor
5.6	2.5	3.9	1.1	Iris-versicolor
5.9	3.2	4.8	1.8	Iris-versicolor
6.1	2.8	4.0	1.3	Iris-versicolor
6.3	2.5	4.9	1.5	Iris-versicolor
6.1	2.8	4.7	1.2	Iris-versicolor
6.4	2.9	4.3	1.3	Iris-versicolor
6.6	3.0	4.4	1.4	Iris-versicolor
6.8	2.8	4.8	1.4	Iris-versicolor
6.7	3.0	5.0	1.7	Iris-versicolor
6.0	2.9	4.5	1.5	Iris-versicolor
5.7	2.6	3.5	1.0	Iris-versicolor
5.5	2.4	3.8	1.1	Iris-versicolor
5.5	2.4	3.7	1.0	Iris-versicolor
5.8	2.7	3.9	1.2	Iris-versicolor
6.0	2.7	5.1	1.6	Iris-versicolor
5.4	3.0	4.5	1.5	Iris-versicolor
6.0	3.4	4.5	1.6	Iris-versicolor
6.7	3.1	4.7	1.5	Iris-versicolor
6.3	2.3	4.4	1.3	Iris-versicolor
5.6	3.0	4.1	1.3	Iris-versicolor
5.5	2.5	4.0	1.3	Iris-versicolor
5.5	2.6	4.4	1.2	Iris-versicolor
6.1	3.0	4.6	1.4	Iris-versicolor
5.8	2.6	4.0	1.2	Iris-versicolor
5.0	2.3	3.3	1.0	Iris-versicolor
5.6	2.7	4.2	1.3	Iris-versicolor
5.7	3.0	4.2	1.2	Iris-versicolor
5.7	2.9	4.2	1.3	Iris-versicolor
6.2	2.9	4.3	1.3	Iris-versicolor
5.1	2.5	3.0	1.1	Iris-versicolor
5.7	2.8	4.1	1.3	Iris-versicolor
6.3	3.3	6.0	2.5	Iris-virginica
5.8	2.7	5.1	1.9	Iris-virginica
7.1	3.0	5.9	2.1	Iris-virginica
6.3	2.9	5.6	1.8	Iris-virginica
6.5	3.0	5.8	2.2	Iris-virginica
7.6	3.0	6.6	2.1	Iris-virginica
4.9	2.5	4.5	1.7	Iris-virginica
7.3	2.9	6.3	1.8	Iris-virginica
6.7	2.5	5.8	1.8	Iris-virginica
7.2	3.6	6.1	2.5	Iris-virginica
6.5	3.2	5.1	2.0	Iris-virginica
6.4	2.7	5.3	1.9	Iris-virginica
6.8	3.0	5.5	2.1	Iris-virginica
5.7	2.5	5.0	2.0	Iris-virginica
5.8	2.8	5.1	2.4	Iris-virginica
6.4	3.2	5.3	2.3	Iris-virginica
6.5	3.0	5.5	1.8	Iris-virginica
7.7	3.8	6.7	2.2	Iris-virginica
7.7	2.6	6.9	2.3	Iris-virginica
6.0	2.2	5.0	1.5	Iris-virginica
6.9	3.2	5.7	2.3	Iris-virginica
5.6	2.8	4.9	2.0	Iris-virginica
7.7	2.8	6.7	2.0	Iris-virginica
6.3	2.7	4.9	1.8	Iris-virginica
6.7	3.3	5.7	2.1	Iris-virginica
7.2	3.2	6.0	1.8	Iris-virginica
6.2	2.8	4.8	1.8	Iris-virginica
6.1	3.0	4.9	1.8	Iris-virginica
6.4	2.8	5.6	2.1	Iris-virginica
7.2	3.0	5.8	1.6	Iris-virginica
7.4	2.8	6.1	1.9	Iris-virginica
7.9	3.8	6.4	2.0	Iris-virginica
6.4	2.8	5.6	2.2	Iris-virginica
6.3	2.8	5.1	1.5	Iris-virginica
6.1	2.6	5.6	1.4	Iris-virginica
7.7	3.0	6.1	2.3	Iris-virginica
6.3	3.4	5.6	2.4	Iris-virginica
6.4	3.1	5.5	1.8	Iris-virginica
6.0	3.0	4.8	1.8	Iris-virginica
6.9	3.1	5.4	2.1	Iris-virginica
6.7	3.1	5.6	2.4	Iris-virginica
6.9	3.1	5.1	2.3	Iris-virginica
5.8	2.7	5.1	1.9	Iris-virginica
6.8	3.2	5.9	2.3	Iris-virginica
6.7	3.3	5.7	2.5	Iris-virginica
6.7	3.0	5.2	2.3	Iris-virginica
6.3	2.5	5.0	1.9	Iris-virginica
6.5	3.0	5.2	2.0	Iris-virginica
6.2	3.4	5.4	2.3	Iris-virginica
5.9	3.0	5.1	1.8	Iris-virginica