HBASE-24080 [flakey test] TestRegionReplicaFailover.testSecondaryRegionKill fails...
[hbase.git] / bin / region_status.rb
blob9307b9f316ef3c65f590aa53d71d870eb9cb6d0c
1 # Licensed to the Apache Software Foundation (ASF) under one
2 # or more contributor license agreements.  See the NOTICE file
3 # distributed with this work for additional information
4 # regarding copyright ownership.  The ASF licenses this file
5 # to you under the Apache License, Version 2.0 (the
6 # "License"); you may not use this file except in compliance
7 # with the License.  You may obtain a copy of the License at
9 #     http://www.apache.org/licenses/LICENSE-2.0
11 # Unless required by applicable law or agreed to in writing, software
12 # distributed under the License is distributed on an "AS IS" BASIS,
13 # WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
14 # See the License for the specific language governing permissions and
15 # limitations under the License.
17 # View the current status of all regions on an HBase cluster.  This is
18 # predominantly used to determined if all the regions in META have been
19 # onlined yet on startup.
21 # To use this script, run:
23 #  ${HBASE_HOME}/bin/hbase org.jruby.Main region_status.rb [wait] [--table <table_name>]
25 require 'optparse'
27 usage = 'Usage : ./hbase org.jruby.Main region_status.rb [wait]' \
28         '[--table <table_name>]\n'
29 OptionParser.new do |o|
30   o.banner = usage
31   o.on('-t', '--table TABLENAME', 'Only process TABLENAME') do |tablename|
32     $tablename = tablename
33   end
34   o.on('-h', '--help', 'Display help message') { puts o; exit }
35   o.parse!
36 end
38 SHOULD_WAIT = ARGV[0] == 'wait'
39 if ARGV[0] && !SHOULD_WAIT
40   print usage
41   exit 1
42 end
44 require 'java'
46 java_import org.apache.hadoop.hbase.HBaseConfiguration
47 java_import org.apache.hadoop.hbase.TableName
48 java_import org.apache.hadoop.hbase.HConstants
49 java_import org.apache.hadoop.hbase.MasterNotRunningException
50 java_import org.apache.hadoop.hbase.client.HBaseAdmin
51 java_import org.apache.hadoop.hbase.client.Table
52 java_import org.apache.hadoop.hbase.client.Scan
53 java_import org.apache.hadoop.hbase.filter.FirstKeyOnlyFilter
54 java_import org.apache.hadoop.hbase.util.Bytes
55 java_import org.apache.hadoop.hbase.HRegionInfo
56 java_import org.apache.hadoop.hbase.MetaTableAccessor
57 java_import org.apache.hadoop.hbase.HTableDescriptor
58 java_import org.apache.hadoop.hbase.client.ConnectionFactory
60 # disable debug logging on this script for clarity
61 log_level = org.apache.log4j.Level::ERROR
62 org.apache.log4j.Logger.getLogger('org.apache.zookeeper').setLevel(log_level)
63 org.apache.log4j.Logger.getLogger('org.apache.hadoop.hbase').setLevel(log_level)
65 config = HBaseConfiguration.create
66 config.set 'fs.defaultFS', config.get(HConstants::HBASE_DIR)
67 connection = ConnectionFactory.createConnection(config)
68 # wait until the master is running
69 admin = nil
70 loop do
71   begin
72     admin = connection.getAdmin
73     break
74   rescue MasterNotRunningException => e
75     print 'Waiting for master to start...\n'
76     sleep 1
77   end
78 end
80 meta_count = 0
81 server_count = 0
83 # scan META to see how many regions we should have
84 if $tablename.nil?
85   scan = Scan.new
86 else
87   tableNameMetaPrefix = $tablename + HConstants::META_ROW_DELIMITER.chr
88   scan = Scan.new(
89     (tableNameMetaPrefix + HConstants::META_ROW_DELIMITER.chr).to_java_bytes
90   )
91 end
92 scan.setCacheBlocks(false)
93 scan.setCaching(10)
94 scan.setFilter(FirstKeyOnlyFilter.new)
95 INFO = 'info'.to_java_bytes
96 REGION_INFO = 'regioninfo'.to_java_bytes
97 scan.addColumn INFO, REGION_INFO
98 table = nil
99 iter = nil
100 loop do
101   begin
102     table = connection.getTable(TableName.valueOf('hbase:meta'))
103     scanner = table.getScanner(scan)
104     iter = scanner.iterator
105     break
106   rescue IOException => ioe
107     print "Exception trying to scan META: #{ioe}"
108     sleep 1
109   end
111 while iter.hasNext
112   result = iter.next
113   rowid = Bytes.toString(result.getRow)
114   rowidStr = java.lang.String.new(rowid)
115   if !$tablename.nil? && !rowidStr.startsWith(tableNameMetaPrefix)
116     # Gone too far, break
117     break
118   end
120   region = MetaTableAccessor.getHRegionInfo(result)
121   unless region.isOffline
122     # only include regions that should be online
123     meta_count += 1
124   end
126 scanner.close
127 # If we're trying to see the status of all HBase tables, we need to include the
128 # hbase:meta table, that is not included in our scan
129 meta_count += 1 if $tablename.nil?
131 # query the master to see how many regions are on region servers
132 $TableName = TableName.valueOf($tablename.to_java_bytes) unless $tablename.nil?
133 loop do
134   if $tablename.nil?
135     server_count = admin.getClusterMetrics.getRegionCount
136   else
137     connection = ConnectionFactory.createConnection(config)
138     server_count = MetaTableAccessor.allTableRegions(connection, $TableName).size
139   end
140   print "Region Status: #{server_count} / #{meta_count}\n"
141   if SHOULD_WAIT && server_count < meta_count
142     # continue this loop until server & meta count match
143     sleep 10
144   else
145     break
146   end
148 admin.close
149 connection.close
151 exit server_count == meta_count ? 0 : 1