Fix output file size estimation.
[cumulus.git] / cumulus-sync
1 #!/usr/bin/python
2 #
3 # Cumulus: Efficient Filesystem Backup to the Cloud
4 # Copyright (C) 2008 The Cumulus Developers
5 # See the AUTHORS file for a list of contributors.
6 #
7 # This program is free software; you can redistribute it and/or modify
8 # it under the terms of the GNU General Public License as published by
9 # the Free Software Foundation; either version 2 of the License, or
10 # (at your option) any later version.
11 #
12 # This program is distributed in the hope that it will be useful,
13 # but WITHOUT ANY WARRANTY; without even the implied warranty of
14 # MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
15 # GNU General Public License for more details.
16 #
17 # You should have received a copy of the GNU General Public License along
18 # with this program; if not, write to the Free Software Foundation, Inc.,
19 # 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA.
20
21 # Tool for copying cumulus archives from one source to another.
22
23 import os, sys
24
25 # Automatically set Python path, based on script directory.  This should be
26 # removed if the tools are properly installed somewhere.
27 script_directory = os.path.dirname(sys.argv[0])
28 sys.path.append(os.path.join(script_directory, 'python'))
29
30 import cumulus
31 import cumulus.store
32
33 store1 = cumulus.BackendWrapper(sys.argv[1])
34 store2 = cumulus.BackendWrapper(sys.argv[2])
35
36 source = cumulus.CumulusStore(store1)
37
38 items_required = set()
39 snapshots = sys.argv[3:]
40 if not snapshots:
41     snapshots = list(source.list_snapshots())
42 for s in snapshots:
43     items_required.add(s)
44     d = cumulus.parse_full(source.load_snapshot(s))
45     items_required.update(d['Segments'].split())
46 print "Required:", items_required
47
48 files_present = set()
49 for filetype in cumulus.SEARCH_PATHS:
50     for (name, path) in store2.list_generic(filetype):
51         items_required.discard(name)
52         files_present.add(path)
53 print "Files already present:", sorted(files_present)
54
55 files_required = []
56 items_found = set()
57 for filetype in cumulus.SEARCH_PATHS:
58     for (name, path) in store1.list_generic(filetype):
59         if name in items_required:
60             files_required.append(path)
61             items_found.add(name)
62 files_required.sort()
63
64 print "Missing:", items_required.difference(items_found)
65 print "Required files:", files_required
66
67 for f in files_required:
68     print f
69     store2.raw_backend.put(f, store1.raw_backend.get(f))