automatic commit
[folded-ctf.git] / rich_image.h
1
2 ///////////////////////////////////////////////////////////////////////////
3 // This program is free software: you can redistribute it and/or modify  //
4 // it under the terms of the version 3 of the GNU General Public License //
5 // as published by the Free Software Foundation.                         //
6 //                                                                       //
7 // This program is distributed in the hope that it will be useful, but   //
8 // WITHOUT ANY WARRANTY; without even the implied warranty of            //
9 // MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the GNU      //
10 // General Public License for more details.                              //
11 //                                                                       //
12 // You should have received a copy of the GNU General Public License     //
13 // along with this program. If not, see <http://www.gnu.org/licenses/>.  //
14 //                                                                       //
15 // Written by Francois Fleuret                                           //
16 // (C) Idiap Research Institute                                          //
17 //                                                                       //
18 // Contact <francois.fleuret@idiap.ch> for comments & bug reports        //
19 ///////////////////////////////////////////////////////////////////////////
20
21 /*
22
23   This class implements the multi-scale basic edge features on the
24   images. The heavy machinery and ugly coding style is motivated by
25   performance.
26
27 */
28
29 #ifndef RICH_IMAGE_H
30 #define RICH_IMAGE_H
31
32 #include "image.h"
33 #include "rgb_image.h"
34 #include "misc.h"
35 #include "global.h"
36
37 class RichImage : public Image {
38
39   static const int _image_size_min = 8;
40
41   int _nb_scales;
42
43   int *_width_at_scale, *_height_at_scale;
44
45   unsigned int *_edge_map;
46
47   unsigned int **_line_edge_map;
48   unsigned int ***_tag_edge_map;
49   unsigned int ****_scale_edge_map;
50
51   void free();
52
53   void compute_one_scale_edge_maps(int width, int height,
54                                    unsigned int ***scale_edge_map,
55                                    unsigned char *pixel_map,
56                                    unsigned int *sum_pixel_map,
57                                    unsigned int *sum_sq_pixel_map);
58
59 public:
60
61   // We have 8 edge orientations
62   static const int nb_edge_tags = 8;
63   static const int first_edge_tag = 0;
64
65   // The variance tag is 1 if the variance of the gray levels in the
66   // 16x16 square is greater than 10
67   static const int variance_tag = 8;
68
69   // We quantify the grayscales into 8 bins
70   static const int nb_gray_tags = 8;
71   static const int first_gray_tag = 9;
72
73   static const int _nb_tags = nb_edge_tags + 1 + nb_gray_tags;
74
75   inline int nb_tags() { return _nb_tags; }
76   inline int nb_scales() { return _nb_scales; }
77
78   inline int nb_tags_in_window(int scale, int tag, int xmin, int ymin, int xmax, int ymax) {
79     if(scale < 0 || scale >= _nb_scales) return 0;
80     if(xmin < 0) xmin = 0;
81     if(xmax >= _width_at_scale[scale]) xmax = _width_at_scale[scale] - 1;
82     if(ymin < 0) ymin = 0;
83     if(ymax >= _height_at_scale[scale]) ymax = _height_at_scale[scale] - 1;
84     if(xmin < xmax && ymin < ymax) {
85       unsigned int **tmp = _scale_edge_map[scale][tag];
86       return tmp[ymax][xmax] + tmp[ymin][xmin] - tmp[ymax][xmin] - tmp[ymin][xmax];
87     } else
88       return 0;
89   }
90
91   RichImage();
92   RichImage(int width, int height);
93   virtual ~RichImage();
94
95   virtual void compute_rich_structure();
96
97   virtual void write(ostream *out);
98
99   // read does _NOT_ build the rich structure. One has to call
100   // compute_rich_structure() for that!
101   virtual void read(istream *in);
102
103   virtual void write_tag_png(const char *filename);
104 };
105
106 #endif