00001
00002
00003
00004
00005
00006
00007
00008
00009
00010
00011
00012
00013
00014
00015
00016
00017
00018
00019
00020
00021
00027 #include "common.h"
00028 #include "pca.h"
00029
00030 typedef struct PCA{
00031 int count;
00032 int n;
00033 double *covariance;
00034 double *mean;
00035 double *z;
00036 }PCA;
00037
00038 PCA *ff_pca_init(int n){
00039 PCA *pca;
00040 if(n<=0)
00041 return NULL;
00042
00043 pca= av_mallocz(sizeof(PCA));
00044 pca->n= n;
00045 pca->z = av_malloc(sizeof(*pca->z) * n);
00046 pca->count=0;
00047 pca->covariance= av_mallocz(sizeof(double)*n*n);
00048 pca->mean= av_mallocz(sizeof(double)*n);
00049
00050 return pca;
00051 }
00052
00053 void ff_pca_free(PCA *pca){
00054 av_freep(&pca->covariance);
00055 av_freep(&pca->mean);
00056 av_freep(&pca->z);
00057 av_free(pca);
00058 }
00059
00060 void ff_pca_add(PCA *pca, double *v){
00061 int i, j;
00062 const int n= pca->n;
00063
00064 for(i=0; i<n; i++){
00065 pca->mean[i] += v[i];
00066 for(j=i; j<n; j++)
00067 pca->covariance[j + i*n] += v[i]*v[j];
00068 }
00069 pca->count++;
00070 }
00071
00072 int ff_pca(PCA *pca, double *eigenvector, double *eigenvalue){
00073 int i, j, pass;
00074 int k=0;
00075 const int n= pca->n;
00076 double *z = pca->z;
00077
00078 memset(eigenvector, 0, sizeof(double)*n*n);
00079
00080 for(j=0; j<n; j++){
00081 pca->mean[j] /= pca->count;
00082 eigenvector[j + j*n] = 1.0;
00083 for(i=0; i<=j; i++){
00084 pca->covariance[j + i*n] /= pca->count;
00085 pca->covariance[j + i*n] -= pca->mean[i] * pca->mean[j];
00086 pca->covariance[i + j*n] = pca->covariance[j + i*n];
00087 }
00088 eigenvalue[j]= pca->covariance[j + j*n];
00089 z[j]= 0;
00090 }
00091
00092 for(pass=0; pass < 50; pass++){
00093 double sum=0;
00094
00095 for(i=0; i<n; i++)
00096 for(j=i+1; j<n; j++)
00097 sum += fabs(pca->covariance[j + i*n]);
00098
00099 if(sum == 0){
00100 for(i=0; i<n; i++){
00101 double maxvalue= -1;
00102 for(j=i; j<n; j++){
00103 if(eigenvalue[j] > maxvalue){
00104 maxvalue= eigenvalue[j];
00105 k= j;
00106 }
00107 }
00108 eigenvalue[k]= eigenvalue[i];
00109 eigenvalue[i]= maxvalue;
00110 for(j=0; j<n; j++){
00111 double tmp= eigenvector[k + j*n];
00112 eigenvector[k + j*n]= eigenvector[i + j*n];
00113 eigenvector[i + j*n]= tmp;
00114 }
00115 }
00116 return pass;
00117 }
00118
00119 for(i=0; i<n; i++){
00120 for(j=i+1; j<n; j++){
00121 double covar= pca->covariance[j + i*n];
00122 double t,c,s,tau,theta, h;
00123
00124 if(pass < 3 && fabs(covar) < sum / (5*n*n))
00125 continue;
00126 if(fabs(covar) == 0.0)
00127 continue;
00128 if(pass >=3 && fabs((eigenvalue[j]+z[j])/covar) > (1LL<<32) && fabs((eigenvalue[i]+z[i])/covar) > (1LL<<32)){
00129 pca->covariance[j + i*n]=0.0;
00130 continue;
00131 }
00132
00133 h= (eigenvalue[j]+z[j]) - (eigenvalue[i]+z[i]);
00134 theta=0.5*h/covar;
00135 t=1.0/(fabs(theta)+sqrt(1.0+theta*theta));
00136 if(theta < 0.0) t = -t;
00137
00138 c=1.0/sqrt(1+t*t);
00139 s=t*c;
00140 tau=s/(1.0+c);
00141 z[i] -= t*covar;
00142 z[j] += t*covar;
00143
00144 #define ROTATE(a,i,j,k,l) {\
00145 double g=a[j + i*n];\
00146 double h=a[l + k*n];\
00147 a[j + i*n]=g-s*(h+g*tau);\
00148 a[l + k*n]=h+s*(g-h*tau); }
00149 for(k=0; k<n; k++) {
00150 if(k!=i && k!=j){
00151 ROTATE(pca->covariance,FFMIN(k,i),FFMAX(k,i),FFMIN(k,j),FFMAX(k,j))
00152 }
00153 ROTATE(eigenvector,k,i,k,j)
00154 }
00155 pca->covariance[j + i*n]=0.0;
00156 }
00157 }
00158 for (i=0; i<n; i++) {
00159 eigenvalue[i] += z[i];
00160 z[i]=0.0;
00161 }
00162 }
00163
00164 return -1;
00165 }
00166
00167 #ifdef TEST
00168
00169 #undef printf
00170 #include <stdio.h>
00171 #include <stdlib.h>
00172 #include "lfg.h"
00173
00174 int main(void){
00175 PCA *pca;
00176 int i, j, k;
00177 #define LEN 8
00178 double eigenvector[LEN*LEN];
00179 double eigenvalue[LEN];
00180 AVLFG prng;
00181
00182 av_lfg_init(&prng, 1);
00183
00184 pca= ff_pca_init(LEN);
00185
00186 for(i=0; i<9000000; i++){
00187 double v[2*LEN+100];
00188 double sum=0;
00189 int pos = av_lfg_get(&prng) % LEN;
00190 int v2 = av_lfg_get(&prng) % 101 - 50;
00191 v[0] = av_lfg_get(&prng) % 101 - 50;
00192 for(j=1; j<8; j++){
00193 if(j<=pos) v[j]= v[0];
00194 else v[j]= v2;
00195 sum += v[j];
00196 }
00197
00198
00199
00200
00201
00202
00203
00204
00205 ff_pca_add(pca, v);
00206 }
00207
00208
00209 ff_pca(pca, eigenvector, eigenvalue);
00210 for(i=0; i<LEN; i++){
00211 pca->count= 1;
00212 pca->mean[i]= 0;
00213
00214
00215
00216
00217
00218 for(j=i; j<LEN; j++){
00219 printf("%f ", pca->covariance[i + j*LEN]);
00220 }
00221 printf("\n");
00222 }
00223
00224 for(i=0; i<LEN; i++){
00225 double v[LEN];
00226 double error=0;
00227 memset(v, 0, sizeof(v));
00228 for(j=0; j<LEN; j++){
00229 for(k=0; k<LEN; k++){
00230 v[j] += pca->covariance[FFMIN(k,j) + FFMAX(k,j)*LEN] * eigenvector[i + k*LEN];
00231 }
00232 v[j] /= eigenvalue[i];
00233 error += fabs(v[j] - eigenvector[i + j*LEN]);
00234 }
00235 printf("%f ", error);
00236 }
00237 printf("\n");
00238
00239 for(i=0; i<LEN; i++){
00240 for(j=0; j<LEN; j++){
00241 printf("%9.6f ", eigenvector[i + j*LEN]);
00242 }
00243 printf(" %9.1f %f\n", eigenvalue[i], eigenvalue[i]/eigenvalue[0]);
00244 }
00245
00246 return 0;
00247 }
00248 #endif