Try an alternate segment cleaning ordering.
[cumulus.git] / schema.sql
1 -- We maintain a local index of data blocks that have been previously stored
2 -- for constructing incremental snapshots.
3 --
4 -- The index is stored in an SQLite3 database.  This is its schema.
5
6 -- List of snapshots which have been created.
7 create table snapshots (
8     snapshotid integer primary key,
9     name text not null,
10     timestamp real
11 );
12
13 -- List of segments which have been created.
14 create table segments (
15     segmentid integer primary key,
16     segment text unique not null
17 );
18
19 -- Index of all blocks which have been stored in a snapshot, by checksum.
20 create table block_index (
21     blockid integer primary key,
22     segmentid integer not null,
23     object text not null,
24     checksum text,
25     size integer,
26     timestamp real,
27     expired integer
28 );
29 create index block_content_index on block_index(checksum);
30 create unique index block_name_index on block_index(segmentid, object);
31
32 -- Index tracking which blocks are used by which snapshots.
33 create table snapshot_contents (
34     blockid integer,
35     snapshotid integer
36 );
37 create unique index snapshot_contents_unique
38     on snapshot_contents(blockid, snapshotid);
39
40 -- Summary statistics for each segment.
41 create view segment_info as select * from
42     (select segmentid, max(timestamp) as mtime,
43             sum(size) as size, count(*) as objects
44        from block_index natural join segments group by segmentid)
45 natural join
46     (select segmentid, sum(size) as used, count(*) as objects_used
47        from block_index where blockid in
48             (select blockid from snapshot_contents) group by segmentid);
49
50 -- Ranking of segments to be cleaned, using a benefit function of
51 -- (fraction free space)*(age of youngest object).
52 create view cleaning_order as select *, (1-u)*age/(u+0.1) as benefit from
53     (select segmentid,
54             cast(used as real) / size as u, julianday('now') - mtime as age
55         from segment_info)
56 where benefit > 0;