]> Dogcows Code - chaz/tar/blobdiff - scripts/tar-snapshot-edit
Update copyright years.
[chaz/tar] / scripts / tar-snapshot-edit
index 92741d3a03203b8127377fa8ffa6fd73623ea5cd..6d9457da1e1b3858e20803aedeb18263cd0c6cfd 100755 (executable)
@@ -1,23 +1,23 @@
 #! /usr/bin/perl -w
 # Display and edit the 'dev' field in tar's snapshots
-# Copyright (C) 2007,2011 Free Software Foundation, Inc.
-#
-# This program is free software; you can redistribute it and/or modify
+# Copyright 2007, 2011, 2013-2014 Free Software Foundation, Inc.
+
+# This file is part of GNU tar.
+
+# GNU tar is free software; you can redistribute it and/or modify
 # it under the terms of the GNU General Public License as published by
-# the Free Software Foundation; either version 2, or (at your option)
-# any later version.
-#
-# This program is distributed in the hope that it will be useful,
+# the Free Software Foundation; either version 3 of the License, or
+# (at your option) any later version.
+
+# GNU tar is distributed in the hope that it will be useful,
 # but WITHOUT ANY WARRANTY; without even the implied warranty of
 # MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
 # GNU General Public License for more details.
-#
+
 # You should have received a copy of the GNU General Public License
-# along with this program; if not, write to the Free Software
-# Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA
-# 02110-1301, USA.
-#
-#
+# along with this program.  If not, see <http://www.gnu.org/licenses/>.
+
+
 # tar-snapshot-edit
 #
 # This script is capable of replacing values in the 'dev' field of an
@@ -28,7 +28,8 @@
 #
 # It can also run a check on all the field values found in the
 # snapshot file, printing out a detailed message when it finds values
-# that would cause an "Unexpected field value in snapshot file" error
+# that would cause an "Unexpected field value in snapshot file",
+# "Numerical result out of range", or "Invalid argument" error
 # if tar were run using that snapshot file as input.  (See the
 # comments included in the definition of the check_field_values
 # routine for more detailed information regarding these checks.)
@@ -39,7 +40,7 @@
 #
 # Modified Aug 25, 2011 by Nathan Stratton Treadway <nathanst AT ontko.com>:
 #   * update Perl syntax to work correctly with more recent versions of
-#     Perl.  (The original code worked with in the v5.8 timeframe but 
+#     Perl.  (The original code worked with in the v5.8 timeframe but
 #     not with Perl v5.10.1 and later.)
 #   * added a "-c" option to check the snapshot file for invalid field values.
 #   * handle NFS indicator character ("+") in version 0 and 1 files
 #     or 2 files.
 #   * tweak output formatting
 #
-#
+# Modified March 13, 2013 by Nathan Stratton Treadway <nathanst AT ontko.com>:
+#   * configure field ranges used for -c option based on the system
+#     architecture (in response to the December 2012 update to GNU tar
+#     enabling support for systems with signed dev_t values).
+#   * when printing the list of device ids found in the snapshot file
+#     (when run in the default mode), print the raw device id values
+#     instead of the hex-string version in those cases where they
+#     can't be converted successfully.  
 
 use Getopt::Std;
+use Config;
+
+my %snapshot_field_ranges;               # used in check_field_values function
 
 ## reading
 
@@ -93,11 +104,11 @@ sub read_incr_db_0 ($$) {
     while (<$file>) {
        /^(\+?)([0-9]*) ([0-9]*) (.*)\n$/ || die("Bad snapshot line $_");
 
-        if ( $1 eq "+" ) {
-          $nfs="1";
-        } else {
-          $nfs="0";
-        }
+       if ( $1 eq "+" ) {
+         $nfs="1";
+       } else {
+         $nfs="0";
+       }
        push @dirs, { nfs=>$nfs,
                      dev=>$2,
                      ino=>$3,
@@ -124,12 +135,12 @@ sub read_incr_db_1 ($$) {
     while (<$file>) {
        /^(\+?)([0-9]*) ([0-9]*) ([0-9]*) ([0-9]*) (.*)\n$/ || die("Bad snapshot line $_");
 
-        if ( $1 eq "+" ) {
-          $nfs="1";
-        } else {
-          $nfs="0";
-        }
+       if ( $1 eq "+" ) {
+         $nfs="1";
+       } else {
+         $nfs="0";
+       }
+
        push @dirs, { nfs=>$nfs,
                      timestamp_sec=>$2,
                      timestamp_nsec=>$3,
@@ -207,79 +218,182 @@ sub show_device_counts ($) {
        $devices{$dev}++;
     }
 
+    my $devstr;
     foreach $dev (sort {$a <=> $b} keys %devices) {
-       printf "  Device 0x%04x occurs $devices{$dev} times.\n", $dev;
+       $devstr = sprintf ("0x%04x", $dev);
+       if ( $dev > 0xffffffff or $dev < 0 or hex($devstr) != $dev ) {
+         # sprintf "%x" will not return a useful value for device ids
+         # that are negative or which overflow the integer size on this
+         # instance of Perl, so we convert the hex string back to a
+         # number, and if it doesn't (numerically) equal the original
+         # device id value, we know the hex conversion hasn't worked.
+         #
+         # Unfortunately, since we're running in "-w" mode, Perl will
+         # also print a warning message if the hex() routine is called
+         # on anything larger than "0xffffffff", even in 64-bit Perl
+         # where such values are actually supported... so we have to
+         # avoid calling hex() at all if the device id is too large or
+         # negative.  (If it's negative, the conversion to an unsigned
+         # integer for the "%x" specifier will mean the result will
+         # always trigger hex()'s warning on a 64-bit machine.)
+         # 
+         # These situations don't seem to occur very often, so for now
+         # when they do occur, we simply print the original text value
+         # that was read from the snapshot file; it will look a bit
+         # funny next to the values that do print in hex, but that's
+         # preferable to printing values that aren't actually correct.
+         $devstr = $dev; 
+       }
+       printf "  Device %s occurs $devices{$dev} times.\n", $devstr;
     }
 }
 
 ## check field values
 
-# returns a warning message if $field isn't a valid string representation
-# of an integer, or if the resulting integer is out of the specified range
-sub validate_integer_field ($$$$) {
-    my $field = shift;
+# initializes the global %snapshot_field_ranges hash, based on the "-a"
+# command-line option if given, otherwise based on the "archname" of
+# the current system.
+#
+# Each value in the hash is a two-element array containing the minimum
+# and maximum allowed values, respectively, for that field in the snapshot
+# file.  GNU tar's allowed values for each architecture are determined
+# in the incremen.c source file, where the TYPE_MIN and TYPE_MAX
+# pre-processor expressions are used to determine the range that can be
+# expressed by the C data type used for each field; the values in the
+# array defined below should match those calculations.  (For tar v1.27
+# and later, the valid ranges for a particular tar binary can easily
+# be determined using the "tar --show-snapshot-field-ranges" command.)
+sub choose_architecture ($) {
+    my $opt_a = shift;
+
+    my $arch = $opt_a ? $opt_a : $Config{'archname'};
+
+    # These ranges apply to Linux 2.4/2.6 on iX86 systems, but are used
+    # by default on unrecognized/unsupported systems, too.
+    %iX86_linux_field_ranges = (
+      timestamp_sec      => [ -2147483648, 2147483647 ],   # min/max of time_t
+      timestamp_nsec     => [ 0, 999999999 ],              # 0 to BILLION-1
+      nfs                => [ 0, 1 ],
+      dev                => [ 0, 18446744073709551615 ],   # min/max of dev_t
+      ino                => [ 0, 4294967295 ],             # min/max of ino_t
+    );
+
+
+    if ( $arch =~ m/^i[\dxX]86-linux/i ) {
+       %snapshot_field_ranges = %iX86_linux_field_ranges;
+       print "Checking snapshot field values using \"iX86-linux\" ranges.\n\n";
+    } elsif ( $arch =~ m/^x86_64-linux/i ) {
+       %snapshot_field_ranges = (
+         timestamp_sec      => [ -9223372036854775808, 9223372036854775807 ],
+         timestamp_nsec     => [ 0, 999999999 ],
+         nfs                => [ 0, 1 ],
+         dev                => [ 0, 18446744073709551615 ],
+         ino                => [ 0, 18446744073709551615 ],
+       );
+       print "Checking snapshot field values using \"x86_64-linux\" ranges.\n\n";
+    } elsif ( $arch =~ m/^IA64.ARCHREV_0/i ) {
+       # HP/UX running on Itanium/ia64 architecture
+       %snapshot_field_ranges = (
+         timestamp_sec      => [ -2147483648, 2147483647 ],
+         timestamp_nsec     => [ 0, 999999999 ],
+         nfs                => [ 0, 1 ],
+         dev                => [ -2147483648, 2147483647 ],
+         ino                => [ 0, 4294967295 ],
+       );
+       print "Checking snapshot field values using \"IA64.ARCHREV_0\" (HP/UX) ranges.\n\n";
+    } else {
+       %snapshot_field_ranges = %iX86_linux_field_ranges;
+       print "Unrecognized architecture \"$arch\"; defaulting to \"iX86-linux\".\n";
+       print "(Use -a option to override.)\n" unless $opt_a;
+       print "\n";
+    } 
+
+    if ( ref(1) ne "" ) {
+       print "(\"bignum\" mode is in effect; skipping 64-bit-integer check.)\n\n"
+    } else {
+       # find the largest max value in the current set of ranges
+       my $maxmax = 0;
+       for $v (values %snapshot_field_ranges ) {
+         $maxmax = $v->[1] if ($v->[1] > $maxmax);
+       }
+       
+       # "~0" translates into a platform-native integer with all bits turned
+       # on -- that is, the largest value that can be represented as
+       # an integer.  We print a warning if our $maxmax value is greater 
+       # than that largest integer, since in that case Perl will switch
+       # to using floats for those large max values.  The wording of
+       # the message assumes that the only way this situation can exist
+       # is that the platform uses 32-bit integers but some of the
+       # snapshot-file fields have 64-bit values.
+       if ( ~0 < $maxmax ) {
+           print <<EOF
+Note: this version of Perl uses 32-bit integers, which means that it
+  will switch to using floating-point numbers when checking the ranges
+  for 64-bit snapshot-file fields.  This normally will work fine, but
+  might fail to detect cases where the value in the input field value is
+  only slightly out of range.  (For example, a "9223372036854775808"
+  might not be recognized as being larger than  9223372036854775807.)
+  If you suspect you are experiencing this problem, you can try running
+  the program using the "-Mbignum" option, as in
+    \$ perl $0 -Mbignum -c [FILES]
+  (but doing so will make the program run *much* slower).
+
+EOF
+       }
+    }
+    
+
+}
+
+# returns a warning message if $field_value isn't a valid string 
+# representation of an integer, or if the resulting integer is out of range
+# defined by the two-element array retrieved using up the $field_name key in
+# the global %snapshot_field_ranges hash.
+sub validate_integer_field ($$) {
+    my $field_value = shift;
     my $field_name = shift;
-    my $min = shift;
-    my $max = shift;
+
+    my ($min, $max) = @{$snapshot_field_ranges{$field_name}};
 
     my $msg = "";
 
-    if ( not $field =~ /^-?\d+$/ ) { 
-       $msg = "      $field_name value contains invalid characters: \"$field\"\n";
-    } else {  
-       if ( $field < $min ) {
-           $msg = "      $field_name value too low: \"$field\" < $min \n";
-        } elsif ( $field > $max ) {
-           $msg = "      $field_name value too high: \"$field\" > $max \n";
-        } 
-    } 
+    if ( not $field_value =~ /^-?\d+$/ ) {
+       $msg = "      $field_name value contains invalid characters: \"$field_value\"\n";
+    } else {
+       if ( $field_value < $min ) {
+           $msg = "      $field_name value too low: \"$field_value\" < $min \n";
+       } elsif ( $field_value > $max ) {
+           $msg = "      $field_name value too high: \"$field_value\" > $max \n";
+       }
+    }
     return $msg;
 }
 
 
 # This routine loops through each directory entry in the $info data
 # structure and prints a warning message if tar would abort with an
-# "Unexpected field value in snapshot file" error upon reading this
-# snapshot file.
+# "Unexpected field value in snapshot file", "Numerical result out of
+# range", or "Invalid argument" error upon reading this snapshot file.
 #
-# (Note that this specific error message was introduced along with the
-# change to snapshot file format "2", starting with tar v1.16 [or,
-# more precisely, v1.15.91].)
+# (Note that the "Unexpected field value in snapshot file" error message
+# was introduced along with the change to snapshot file format "2",
+# starting with tar v1.16 [or, more precisely, v1.15.91], while the
+# other two were introduced in v1.27.)
 #
 # The checks here are intended to match those found in the incremen.c
-# source file (as of tar v1.16.1).  
-#
-# In that code, the checks are done against pre-processor expressions,
-# as defined in the C header files at compile time.   In the routine
-# below, a Perl variable is created for each expression used as part of
-# one of these checks, assigned the value of the related pre-processor
-# expression as found on a Linux 2.6.8/i386 system.  
-#
-# It seems likely that these settings will catch most invalid
-# field values found in actual snapshot files on all systems.  However,
-# if "tar" is erroring out on a snapshot file that this check routine
-# does not complain about, that probably indicates that the values
-# below need to be adjusted to match those used by "tar" in that
-# particular environment.
+# source file.  See the choose_architecture() function (above) for more 
+# information on how to configure the range of values considered valid 
+# by this script.
 #
 # (Note: the checks here are taken from the code that processes
 # version 2 snapshot files, but to keep things simple we apply those
-# same checks to files having earlier versions -- but only for 
+# same checks to files having earlier versions -- but only for
 # the fields that actually exist in those input files.)
 
 sub check_field_values ($) {
     my $info = shift;
 
-    # set up a variable with the value of each pre-processor 
-    # expression used for field-value checks in incremen.c 
-    # (these values here are from a Linux 2.6.8/i386 system) 
-    my $BILLION = 1000000000;        # BILLION
-    my $MIN_TIME_T = -2147483648;    # TYPE_MINIMUM(time_t)
-    my $MAX_TIME_T = 2147483647;     # TYPE_MAXIUMUM(time_t)
-    my $MAX_DEV_T = 4294967295;      # TYPE_MAXIUMUM(dev_t)
-    my $MAX_INO_T = 4294967295;      # TYPE_MAXIUMUM(ino_t)
-
-
     my $msg;
     my $error_found = 0;
 
@@ -288,14 +402,12 @@ sub check_field_values ($) {
     $snapver = $info->[0];
 
     $msg = "";
-    $msg .= validate_integer_field($info->[1],
-                          'timestamp_sec', $MIN_TIME_T, $MAX_TIME_T);
+    $msg .= validate_integer_field($info->[1], 'timestamp_sec');
     if ($snapver >= 1) {
-      $msg .= validate_integer_field($info->[2],
-                          'timestamp_nsec', 0, $BILLION-1);
-    } 
+      $msg .= validate_integer_field($info->[2], 'timestamp_nsec');
+    }
     if ( $msg ne "" ) {
-        $error_found = 1;
+       $error_found = 1;
        print "\n    shapshot file header:\n";
        print $msg;
     }
@@ -305,26 +417,24 @@ sub check_field_values ($) {
 
        $msg = "";
 
-       $msg .= validate_integer_field($dir->{'nfs'}, 'nfs', 0, 1);
-        if ($snapver >= 1) {
-         $msg .= validate_integer_field($dir->{'timestamp_sec'},
-                               'timestamp_sec', $MIN_TIME_T, $MAX_TIME_T);
-         $msg .= validate_integer_field($dir->{'timestamp_nsec'},
-                               'timestamp_nsec', 0, $BILLION-1);
+       $msg .= validate_integer_field($dir->{'nfs'}, 'nfs');
+       if ($snapver >= 1) {
+         $msg .= validate_integer_field($dir->{'timestamp_sec'}, 'timestamp_sec');
+         $msg .= validate_integer_field($dir->{'timestamp_nsec'}, 'timestamp_nsec');
        }
-       $msg .= validate_integer_field($dir->{'dev'}, 'dev', 0, $MAX_DEV_T);
-       $msg .= validate_integer_field($dir->{'ino'}, 'ino', 0, $MAX_INO_T);
+       $msg .= validate_integer_field($dir->{'dev'}, 'dev');
+       $msg .= validate_integer_field($dir->{'ino'}, 'ino');
 
        if ( $msg ne "" ) {
-          $error_found = 1;
+         $error_found = 1;
          print "\n    directory: $dir->{'name'}\n";
          print $msg;
        }
     }
 
     print "\n  Snapshot field value check complete" ,
-           $error_found ?  "" : ", no errors found" , 
-           ".\n";
+          $error_found ?  "" : ", no errors found" ,
+          ".\n";
 }
 
 ## editing
@@ -336,12 +446,12 @@ sub replace_device_number ($@) {
     my $count = 0;
 
     foreach my $dir (@{$info->[3]}) {
-        foreach $x (@repl) {
+       foreach $x (@repl) {
            if ($dir->{'dev'} eq $$x[0]) {
-               $dir->{'dev'} = $$x[1];
-                $count++;
-                last;
-            }
+               $dir->{'dev'} = $$x[1];
+               $count++;
+               last;
+           }
        }
     }
     print "  Updated $count records.\n"
@@ -372,14 +482,14 @@ sub write_incr_db ($$) {
 sub write_incr_db_0 ($$) {
     my $info = shift;
     my $file = shift;
-    
+
     my $timestamp_sec = $info->[1];
     print $file "$timestamp_sec\n";
 
     foreach my $dir (@{$info->[3]}) {
-        if ($dir->{'nfs'}) {
-          print $file '+'
-        }
+       if ($dir->{'nfs'}) {
+         print $file '+'
+       }
        print $file "$dir->{'dev'} ";
        print $file "$dir->{'ino'} ";
        print $file "$dir->{'name'}\n";
@@ -390,7 +500,7 @@ sub write_incr_db_0 ($$) {
 sub write_incr_db_1 ($$) {
     my $info = shift;
     my $file = shift;
-    
+
     print $file $info->[4];
 
     my $timestamp_sec = $info->[1];
@@ -398,9 +508,9 @@ sub write_incr_db_1 ($$) {
     print $file "$timestamp_sec $timestamp_nsec\n";
 
     foreach my $dir (@{$info->[3]}) {
-        if ($dir->{'nfs'}) {
-          print $file '+'
-        }
+       if ($dir->{'nfs'}) {
+         print $file '+'
+       }
        print $file "$dir->{'timestamp_sec'} ";
        print $file "$dir->{'timestamp_nsec'} ";
        print $file "$dir->{'dev'} ";
@@ -413,7 +523,7 @@ sub write_incr_db_1 ($$) {
 sub write_incr_db_2 ($$) {
     my $info = shift;
     my $file = shift;
-    
+
     print $file $info->[4];
 
     my $timestamp_sec = $info->[1];
@@ -438,10 +548,10 @@ sub write_incr_db_2 ($$) {
 ## main
 
 sub main {
-    our ($opt_b, $opt_r, $opt_h, $opt_c);
-    getopts('br:hc');
+    our ($opt_b, $opt_r, $opt_h, $opt_c, $opt_a);
+    getopts('br:hca:');
     HELP_MESSAGE() if ($opt_h || $#ARGV == -1 || ($opt_b && !$opt_r) ||
-                       ($opt_r && $opt_c) );
+                      ($opt_a && !$opt_c) || ($opt_r && $opt_c) );
 
     my @repl;
     if ($opt_r) {
@@ -451,9 +561,11 @@ sub main {
        }
     }
 
+    choose_architecture($opt_a) if ($opt_c);
+
     foreach my $snapfile (@ARGV) {
        my $info = read_incr_db($snapfile);
-       if ($opt_r ) {
+       if ($opt_r) {
            if ($opt_b) {
                rename($snapfile, $snapfile . "~") || die "Could not rename '$snapfile' to backup";
            }
@@ -474,9 +586,9 @@ sub HELP_MESSAGE {
 Usage:
   tar-snapshot-edit SNAPFILE [SNAPFILE [...]]
   tar-snapshot-edit -r 'DEV1-DEV2[,DEV3-DEV4...]' [-b] SNAPFILE [SNAPFILE [...]]
-  tar-snapshot-edit -c SNAPFILE [SNAPFILE [...]]
+  tar-snapshot-edit -c [-aARCH] SNAPFILE [SNAPFILE [...]]
 
-     With no options specified: print a summary of the 'device' values 
+     With no options specified: print a summary of the 'device' values
      found in each SNAPFILE.
 
      With -r: replace occurrences of DEV1 with DEV2 in each SNAPFILE.
@@ -487,9 +599,21 @@ Usage:
 
      With -c: Check the field values in each SNAPFILE and print warning
      messages if any invalid values are found.  (An invalid value is one
-     that would cause \"tar\" to generate an 
-         Unexpected field value in snapshot file 
-     error message as it processed the snapshot file.)
+     that would cause \"tar\" to abort with an error message such as
+       Unexpected field value in snapshot file
+       Numerical result out of range
+     or 
+       Invalid argument
+     as it processed the snapshot file.)
+
+     Normally the program automatically chooses the valid ranges for 
+     the fields based on the current system's architecture, but the 
+     -a option can be used to override the selection, e.g. in order 
+     to validate a snapshot file generated on a some other system.
+     (Currently only three architectures are supported, "iX86-linux",
+     "x86_64-linux", and "IA64.ARCHREV_0" [HP/UX running on Itanium/ia64], 
+     and if the current system isn't recognized, then the iX86-linux
+     values are used by default.)
 
 EOF
     exit 1;
This page took 0.029507 seconds and 4 git commands to generate.