allow passing dbhost/dbport to tests under Pg
[MogileFS-Server.git] / CHANGES
blob9521eab313f6c3070fd29082e00da2263866e205
1    * New test env variables: MOGTEST_DBROOT{USER,PASS} for easier test usage. (Robin H. Johnson <robbat2@gentoo.org>)
3    * Document test variables. (Robin H. Johnson <robbat2@gentoo.org>)
4    
5    * Support inclusion of custom lighttpd config. (Jason Mills <jmmills@cpan.org>)
7 2011-01-13: Release version 2.46
9    * Fix job_master crash under postgres (Robin H. Johnson <robbat2@gentoo.org>)
11    * Revert "only dbh->ping if not used in over a minute" (dormando <dormando@rydia.net>)
12       *IMPORTANT FIX* if you're using 2.45, you should upgrade to this.
14    * Example application. (dormando <dormando@rydia.net>)
16    * missing $fidid for source_down error message (dormando <dormando@rydia.net>)
18 2011-01-08: Release version 2.45
20    * file_debug command (dormando <dormando@rydia.net>)
22    * add "file_info" command for fetching metadata. (dormando <dormando@rydia.net>)
24    * don't allow clients to upload to the wrong dev (dormando <dormando@rydia.net>)
26    * validate database handles in the right places (dormando <dormando@rydia.net>)
28    * only dbh->ping if not used in over a minute (dormando <dormando@rydia.net>)
30    * make list_fids work with gaps (dormando <dormando@rydia.net>)
32    * Postgres enqueue_fids_* cleanup (Robin H. Johnson <robbat2@gentoo.org>)
34    * Fixes MogileFS::Store::retry_on_deadlock to honor non-deadlock exceptions (Jason Mills <jmmills@cpan.org>)
36    * Implements tests for MogileFS::Store::retry_on_deadlock (Jason Mills <jmmills@cpan.org>)
38    * Implements tests for MogileFS::Store::ignore_replace (Jason Mills <jmmills@cpan.org>)
40    * job_master was never revalidating its dbh handle. (dormando <dormando@rydia.net>)
42    * add a couple useful stats (dormando <dormando@rydia.net>)
44    * Correct iostat command on darwin (Tomas Doran <bobtfish@bobtfish.net>)
46    * Fix test db creation with SQLite (Tomas Doran <bobtfish@bobtfish.net>)
48    * Fix SQLite so tracker at least starts (Tomas Doran <bobtfish@bobtfish.net>)
50    * additional debian packaging fixes (kad <kad@blegh.net>)
52    * debian packaging updates. (Andre Bohr <andrepascha@googlemail.com>)
54    * Documentation updates. (Pyry Hakulinen <pyh@iki.fi>)
56    * HTTPFile returns -1 if the file is missing from the device. Content-Length: 0 is valid and it should return BLEN not MISS. (Pyry Hakulinen <pyh@iki.fi>)
58    * some further editing of the info file. (dormando <dormando@rydia.net>)
60    * Changed repository metadata (Tomas Doran <bobtfish@bobtfish.net>)
62 2010-11-25: Release version 2.44
64         * Fix issue with rebalance not filtering source devs from the
65           destination list.
67         * Make global rebalance limits work (Martijn Lina)
69 2010-10-10: Release version 2.43
71         * Make over-replication fixable again. (sigh)
73         * Fix old bug in MultipleHosts() which would not let you drop from
74           mindev > 1 down to 1.
76 2010-10-08: Release version 2.42
78         * Make FSCK run again (Andre Pascha)
80         * Fix Postgres schema upgrade issue (hopefully)
82 2010-10-06: Release version 2.41
84         * One line change that to fix uprading to 2.40
86 2010-09-28: Release version 2.40
88         * Optimize worker sleep patterns and worker/parent communications.
90         * New rebalance/drain code. See the docs/wiki for how to use.
91           ***NOTE*** Old drain/rebalance code is disabled. Setting a device
92           into drain mode no longer does what you think it would.
93           http://code.google.com/p/mogilefs/wiki/Rebalance
95 2010-08-13: Release version 2.37
97         * Make HTTP DELETE's work reliably
99         * Fix obscure crashes related to "unknown devices"
101         * make it slightly harder to crash trackers with bad slave DB settings
102           (Tomas Doran)
104         * make tracker -> storage node connection timeout configurable.
105           was hardcoded to 2 seconds. (Tomas Doran)
107         * update_class command (Tomas Doran)
109 2010-04-16: Release version 2.36
111         * Bump required version of perlbal for mogstored.
113         * Critical bug fix for creating files.
114           If you have many dead devices, poor filter ordering could cause
115           MogileFS to not consider any alive devices for new files.
117         * Actually default to BIGINT under MySQL...
118           Bug would always initialize new setups to INT.
120 2010-04-02: Release version 2.35
122         * Nuke ancient mogilefs 1.1 replication code.
123           no_unreachable_tracking and old_repl_compat variables are gone.
124           (dormando)
126         * Support modifying class replpolicy strings (requires new
127           mogadm/MogileFS::Client) (dormando)
129         * Print fidid and devid on errors when fsck fails to fix something
130           (t0m)
132         * Allow list_keys to work with a prefix of '0' (dormando)
134         * Print timestamp when logging to STDOUT (t0m)
136         * Sort by free space and weight fewer devices to avoid CPU churn
137           (dormando)
139         * Fix deadlock-related crash bugs in db queue fetch routines.
141         * Fix dependencies in MogileFS::Server (t0m)
143         * Fix bug in list_keys command that prevented searches with a
144           '0' prefix. (Ask Bjørn Hansen)
146 2009-12-05: Release version 2.34
148         * Fix bug in new copycount reduction code. If it was more than off by
149           one it wouldn't reduce the count properly.
151         * Improve accept loop. A reasonably busy tracker could start dropping
152           new client connections too easily.
154 2009-11-24: Release version 2.33
156         * 'mogadm fsck status' will now be more accurate.
158         * Support non-GNU df (paul armstrong)
160         * Remove old !replication command. It's in `mogadm stats` and tends
161           to kill the parent process.
163         * Force refreshing internal monitoring status every 5 minutes. Help
164           work around a potential bug where state changes are missed.
166         * Use new delete queue for tempfile culling
168         * Calculate free space from available space, not total space
169           (todd lipcon)
171         * FSCK code has new tunables to control how aggressive it runs:
172           queue_size_for_fsck (how many fids to keep in file_to_queue table)
173           queue_rate_for_fsck (how many fids to put into the table per second)
174           the generic internal queue is now tunable:
175           internal_queue_limit (how many fids to pull out of a queue table at
176               once. old default was 500).
177           All are tunable by 'mogadm settings set'
178           (dormando)
180         * Replication will now attempt to handle over replication situations.
181           FSCK will catch over replication as a policy violation, and
182           replicate will attempt to fix it. (dormando)
183           (rarely it might need multiple fscks)
185         * Since FIDSizes is no longer used, remove it and remove gearman
186           dependency. (dormando)
188         * FSCK no longer rabidly fills the queue table. (dormando)
190         * Make storage code resilient to rare deadlocks (dormando)
192         * Add 'max_handles' config option to restart a DB connection if there
193           are too many handles to it (victori).
195 2009-10-18: Release version 2.32
197         * No changes... MFS is hard to release due to mogdeps :/
199 2009-10-18: Release version 2.31
201         * Fix create_close race condition. (pipegeek)
203         * Fix bug in reporting of available disk space.
205         * Many minor bug/documentation fixes.
207         * MySQL and Postgres installs now use BIGINT's for fid/length by
208           default. (dormando, robbat2)
210         * Accept 405 responses to MKCOL from the WebDAV server since it often
211           just means that the directory already exists. (Ask Bjørn Hansen)
213         * Fix showing domain and class in mogadm output when there's only the
214           default class in the domain (Mark Imbriaco)
216         * mogstored: pidfile support
218         * New FSCK work and error for BCNT for bad devcount values (they would
219           not otherwise be caught unless the triggered another fix).
221 2009-01-12: Release version 2.30
223         * fsck will now fix broken 'devcount' cols.
225         * schema version bump to 12, and new delete worker code to use the new
226           queue system. delete should be faster and more scalable.
228         * add server setting queue_rate_for_fsck to allow rate limiting how
229           fast the new distributed fsck creates jobs. the original default of
230           10k could utterly defeat wimpy databases.
232         * Support 0 byte files.
234         * Fix a bug where rebalance would accidentally delete copies of a fid.
236         * Create new internal queue management system, with new job
237           'JobMaster'. This greatly reduces database load and increases
238           throughput for workers using the new system.
240         * Add 'no_unreachable_tracking' config. Disables more of the old
241           replication code. Use this if you have no 1.x trackers.
243         * Add hook for alternate replication sources. Obscure, but can be
244           nice.
246         * Add replicate_order_final_choices hook, so multidc replication may
247           pull from the local network if one copy already exists.
249         * Fix subtle bugs in process management.
251         * Allow overriding of default classes.
253 2008-08-18: Release version 2.20
255         * One more time, and hopefully never again. No changes. META.yml
256           fixes.
258 2008-08-18: Release version 2.19
260         * No changes except for META.yml fixes.
261           _should_ be able to upload releases without owning half of CPAN.
263 2008-08-16: Release version 2.18
265         * Add repl_use_get_port option (Brian Lynch)
267         * Remove tempfile data and rows on create_close (Chaos Wang)
269         * Don't delete files accidentally during tempfile table cleanup
271         * Specify username to run the mogstored daemon (Jonathan Share)
273         * Many spelling errors corrected.
275         * PostGres locking routines did not include the hostname for the lock
276           release.
278         * RFC 2518 says we "should" use a trailing slash when calling
279           MKCOL. Some servers (nginx) appears to require it. (Spotted by
280           Timu Eren).
282         * Add server option 'rebalance_ignore_missing' in mogilefsd config
283           that allows the rebalance to ignore files that are already missing
284           when it tries to delete them.
286         * Fix MultipleHosts replication policy to no longer return desperate
287           devices after no longer being desperate, instead returning a state
288           which will queue for retries in the future till it can be truly
289           happy. This prevents files from being replicated to all writable
290           devs when there are two few writable hosts to satisfy the policy.
292         * Add --chmod-mountpoints option to mogautomount, in an attempt to
293           prevent mogstored machines from accidentally writing to their under-
294           lying filesystem.
296         * New optional argument 'startpos' to fsck_reset.
298         * Use correct per-Store port, defaulting to UNIX sockets on localhost.
300         * add --dbport option to mogdbsetup (Ask Bjoern Hansen)
302         * Fix state_change() bug that could make file_to_delete_later
303           grow unnecessarily (Radu Greab)
305         * Add Mogstored::HTTPServer::None to allow using mogstored
306           with unmanaged backend DAV servers.
308         * Add experimental cmd_edit_file. Client requires DAV MOVE and
309           partial PUT on the store to use it.
311         * make mogstored and mogilefsd use the now-bundled dependency
312           Perl modules as a last resort, unless MOGILE_NO_BUILTIN_DEPS
313           environment variable is true.  this makes it easier for people
314           to use mogilefs, without dependency hell.  distros/packagers
315           are expected to ignore (or scoff at) this "feature".  but
316           easier for people working from tarball/svn releases.  bundled
317           dependencies will be updated over time, as needed.
319         * Bring the SQLite store up to date
321         * Increase the timeouts in the test suite
323         * In the test suite, also search for mogadm in /usr/local/bin/ and
324           /usr/local/sbin (spotted by Dean Wilson)
326         * SCHEMA VERSION 10:  'replpolicy' column on 'class' table.
327           it's safe to --ignore-schema-version and run this mogilefsd
328           against an older schema.  new column enables per-class
329           pluggable replication policies.  it was always
330           abstract, but not easy to plugin your own alternatives.
331           see doc/pluggable-replication-policies.txt
333         * add start of a MogileFS::ReplicationPolicy::Union implementation
335         * fix crash in queryworker's create_open command, when a device
336           has its directory made on a mogile storage node (the host of
337           which is being monitored by the 'monitor' process), but the
338           device isn't registered in the devices table yet.
340 2007-07-03: Release version 2.17
342         * get_paths command now takes a pathcount option, defaulting to
343           2, instead of having a hardcoded constant of 2. This allows
344           requesting more than 2 paths to a file.
346         * make fsck log over-replicated files as policy violations.  it
347           won't delete over-replicated files, though, just log
349         * Document how to test MogileFS under doc/testing.txt. You really
350           should read this if you want to use MogileFS to store your data.
352         * Add a safety check to ensure that Postgresql-8.2 or newer is used.
354         * Update mogdbsetup usage, and ensure it chooses the correct admin
355           username automatically.
357         * Document the --type option to mogdbsetup.
359         * Introduce the PostGres Store implementation. The locking system might
360           still have issues, beware of stale locks! Initial prototype by Radu
361           Greab <rg@yx.ro>, and developed heavily by Robin H. Johnson
362           <robbat2@gentoo.org>.
364         * start of support to make mogstored wrap Apache + web_dav
366         * Remove duplicated [fsck] in log output of Fsck worker.
368         * Handle HiRes gettimeofday correctly to get useful results. Arrays are
369           important. This gives us correct timing output.
371         * Handle input to log() correctly. Based on the implementation of
372           Sys::Syslog::syslog(), produces no ugly warnings, and makes sure that
373           printf stuff works nicely.
375         * The unix_timestamp function belongs to the Store, not other classes.
376           Need to add test cases for process_deletes and stats.
378         * Using NULL during an INSERT for the AUTO_INCREMENT column does not
379           work very well outside of MySQL. Pass the correct number of arguments
380           to the INSERT instead.
382         * Clean up all raw usages of UNIX_TIMESTAMP() function, in preparation
383           for database independence. If you need the unix timestamp, include the output
384           of $self->unix_timestamp directly into your query.
386         * Alter $0 so that the scripts show up as '$SCRIPTNAME' in the process
387           listing instead of '/usr/bin/perl $SCRIPTNAME'. This makes init.d
388           scripts easier to manage.
390         * make mogstored's lighttpd config use mod_status for "/", so
391           mogadm doesn't think it's dead when it previously saw a 404
392           (Justin Huff <jjhuff@mspin.net>)
394         * remove Linux::AIO support, now that Perlbal has removed it as well,
395           and because Linux::AIO support (when Perlbal then chooses
396           IO::AIO) was hanging mogstored on shutdown.  so also add a
397           mogstored shutdown test (after a full daemonization of it)
399         * make Mgd::validate_dbh() re-check/ping slave dbhs as well.
400           (problem mentioned by Steven Shou <steven.shou@verizon.net>)
402         * support drive identifiers above sdz (Arjan <info@bouncetek.com>)
404         * make mogstored's iostat child process properly shutdown,
405           even when iostat binary isn't installed.  (previously
406           it was stuck in a loop every 10 seconds, hoping for
407           iostat to be installed, but never respecting parent
408           process' death)
410         * Change delete worker to use new DeviceStates interface.
412         * Fix get_paths to honor new device state of 'drain' via new
413           DeviceStates interface.
415         * use significantly less CPU when re-broadcasting around
416           iostat device utilization% to child processes.  (future:
417           don't rebroadcast at all and use shared memory)
419         * slightly faster fsck (do less syscalls)
421         * efficiency: don't broadcast dup state information to children
422           (track in parent what children know already)
424         * if using Gearman::Server >= 1.09, respawn the fidsizes
425           worker if it dies.
427 2007-05-09: Release version 2.16
429         * BUG FIX from 2.15:  partially written but never closed
430           tempfiles weren't being cleaned up properly.
432         * start to work better when compiled as a stand-alone
433           PAR all-in-one script/archive
435 2007-05-07: Release version 2.15 ("fsck/drain/rebalance")
437         * minor bug fixes and enhancements for MultipleHosts replication
438           policy.  bunch of corner cases now checked with new tests.
439           now easy to write more replication policy tests in future.
441         * replication policies can now return "desperate" requests,
442           signalling that a replication reassessment should be
443           enqueued for the future, to see if things could be improved.
444           (that part's not currently implemented, but the real feature
445            and motivation is that the rebalancer now won't delete a
446            DevFID if it results in a desperate move, only an ideal move. )
448         * replication policies now can optionally return a new return
449           value of the (new) type MogileFS::ReplicationRequest, which
450           has pretty accessor names, can suggest multiple places,
451           can indicate non-ideal emergency replication decisions.
452           old plugins' return values will be transparently upgraded
453           to the equivalent new return value objects.
455         * adding new device state: "drain".  it's a hybrid of "dead"
456           (in that files are migrated off it) and "readonly", it that
457           it still serves traffic... it just doesn't get new files.
458           this also introduces the new object-oriented DeviceState class,
459           and device_state($name) utility function to get the DeviceState
460           singleton by name
462         * internal code cleanup.  notably, kill the old & nasty legacy
463           'find_deviceid' function which was ridiculously long and hairy.
464           the two callers are now more readable with sorts/greps/etc.
466         * make mogstored's devN/usage writing process (DiskUsage) be less
467           racy with the mogilefsd monitoring code... don't open file for
468           write... open read/write, then in one write system call, write
469           the entire file, with newline padding at end to cover old data,
470           then truncate it if necessary.  should remove harmless (but scary)
471           error messages previously reported by the mogilefsd monitor
472           about zero-length usage files.
474         * new protocol commands to list/set (certain) server settings,
475           with value sanity checking (see MogileFS::Config for which
476           are settable, and with what values).  needed for "enable_rebalance".
477           was partially enabled before for slave settings.  also needed
478           for memcached support before, which was never possible to
479           set with mogadm, only with db tweaking.
481         * make mogilefsd fsck use new mogstored fid_sizes command, to
482           do bulk stats.  speeds up fscks a ton.
484         * be robust against system clocks that go backwards between
485           gettimeofday calls:
486           http://lists.danga.com/pipermail/mogilefs/2007-April/000897.html
488         * Put gearman server in mogstored process, add worker
489           'mogstored-fidsizes' which runs as subprocess of mogstored. Add
490           side-channel command 'fid_sizes' which allows us to quickly enumerate
491           and get sizes for files across entire devices on a storage node.
493         * remove all code like $state eq "readonly", $state=~ /^dead|down$/
494           and instead convert it into specific questions on policy/traits
495           of given state, like $dev->should_put_new_files_on, or
496           $dev->should_drain_files_off.  see MogileFS::DeviceState,
497           objects of which are accessed via $dev->dstate, or new
498           MogileFS::Util device_state($name) wrapper.
500         * start of rebalance support.  (where replication workers, in their
501           idle time, can rearrange files to even out disk space and/or IO
502           activity on storage nodes... policy isn't hard-coded, and is
503           in fact currently random)
505         * lighttpd support in both mogilefsd and mogstored.  passes test
506           suite with environment MOGSTORED_SERVER_TYPE=lighttpd set now.
508         * abstract out the HTTP server support in mogstored, so
509           mogstored isn't just a perlbal wrapper, but an anything
510           wrapper. (in particular, lighttpd and apache)  mogstored still
511           exists for all its other misc admin/monitoring functions,
512           but can then manage/configure apache/lighttpd child process(es).
513           so far they're just stubbed out.
515         * split mogstored into separate files per class, rather than one
516           large script.
518 2007-04-24: Release version 2.10
520         * bug from earlier refactoring:  changing some 'next' to 'return'
521           in MogileFS::Device's create_directory method.  (thanks to
522           Justin Huff <jjhuff@mspin.net>)
524         * make sure mogdbsetup doesn't upgrade an existing table (with
525           potentially lot of data) from MyISAM to InnoDB.  just warn.
526           only new tables should become InnoDB on creation.  also,
527           detect InnoDB even on old MySQL 4.0.x, not just 4.1/5.0.
529         * make fsck faster by reducing number of db queries (both
530           reads and writes), though more unrelated fastness remains to
531           be done.
533         * make fsck_status faster (keep summary stats of evcode counts,
534           rather than doing a full GROUP BY query all the time)
536 2007-04-20: Release version 2.09
538         * filesystem checker (Fsck worker).  off by default, unless
539           it's enabled via protocol.  Control/monitor it with mogadm
540           in MogileFS-Utils 2.08, which needs MogileFS::Client 1.06.
542         * replication speed-up on configurations with only 1 host.
543           (replication would randomly have no suggestions before, when
544            there was only 1 target host, so replication would be rescheduled
545            until the future, when random returned a different device on
546            that host)
548 2007-04-17: Release version 2.08
550         * (no runtime-visible changes from 2.07)
552         * mogilefsd: remove incomplete "Checker" worker, replace with
553           incomplete "Fsck" worker.
555         * test cleanup/robustness improvements.  properly skips testing when
556           testing deps not found.  but searches harder for them now, too.
557           tests run under "make disttest".
559         * packaging cleanups, released using ShipIt.
562 2007-03/04:
564         * mogilefsd: Split Plugin::MetaData and Plugin::FilePaths into their own distributions.
566         * mogilefsd: Fix mogdbsetup to not ask empty questions.
568         * mogilefsd: command line/config file support for listening on specific IPs, also
569            support for listening on multiple IPs/ports
571 2007-03-19:
572         * mogstored: use XS HTTPHeaders by default, unless disabled with environment variable
574         * mogilefsd: memcache support for get_paths (see doc/memcache-support.txt)
576 2007-03-16:
577         * mogstored: make child processes be exec'ed (as as their own scripts, not inheriting
578           Perlbal, Linux::AIO/IO::AIO, etc baggage).  so they don't own listening
579           sockets, pipes to child workers, signal handlers, etc.  just a lot
580           cleaner now, and SIGTERM, SIGINT properly shut everything down now,
581           both in foreground and as daemon
583 2007-03-15:
584         * mogstored: this changelog is totally neglected.  :/  see svn log.
586         * mogstored: make perlbal's "shutdown graceful" work, by not doing
587           sidechannel accepting ourselves (which never hung up),
588           but subclass Perlbal's TCPListener class, which does it
589           all correctly.
591 2006-12/2007-01:  (2.00_05)
592         * mogilefsd: everything converted to OO API internally.  old internal APIs removed.
594         * mogilefsd: be database-agnostic.  Currently only works with MySQL (and
595            SQLite as a joke/demo), but Pg/Oracle coming in the future.
597         * mogilefsd: built-in I/O activity monitoring between mogstored/mogilefsd Monitor
598            now.
600         * mogilefsd: much improved internal communication between worker processes
602         * mogilefsd: start of better docs
604 2006-12-28
605         * mogilefsd: pidfile support (Radu Greab <radu@yx.ro>)
607 2006-12-28
608 2006-12-27
609         * mogilefsd: remove all old internal APIs, update everything to use new OO APIs,
610            expanding OO APIs where necessary (lots of places).  so much more
611            beautifully hackable now.
613         * mogstored: kill child processes (diskusage and iostat) when being killed.
615 2006-11-05:
616         * mogstored: set aio threads after daemonizing.  needed by Linux::AIO/IO::AIO, it seems?
618 2006-09-29
619         * mogilefsd: remove non-HTTP mode ("NFS mode") from the server
621 2006-09-23:
622         * mogstored: refuse to start up with missing Linux::AIO/IO::AIO or broken Linux::AIO
624 2006-09-04:
625         * mogstored: set aio_threads as a function of number of disks
627 2006-07 -> 2006-09
628         * mogilefsd: major refactoring/cleanup/new features ("MogileFS 2.0")
630 2006-03-01 (Brad)
631         * mogilefsd: fix dataloss bug when the 'tempfile' table is InnoDB and the
632            server is restarted while the tempfile table is empty.
634 2006-02-28 (Jr)
635         * mogilefsd: allow create_open to take optional fid parameter which enables you to
636         dictate which fid to use internally and to not rely on MySQL's auto_increment
638 2006-01-10 (Brad)
639         * mogilefsd: make Mgd::get_device_summary() always return all devices, regardless
640         of status.
642         * mogilefsd: update all callers of get_device_summary to filter on the device
643         status, if they need to. (provided more clarity into what
644         callers' intentions were...)
646         * mogilefsd: add a new device state 'readonly' which means: it can be read from
647         from clients, it can be replicated from, but no new files can go
648         on it or be replicated onto it. and it also reaps, meaning the
649         device is fucked. the filesystem probably ate itself.
651 2005-08-10:
652         * mogstored: write out usage files for devices, even if they're not on their own mount point.
653           also explicitly include the '-k' flag to df, so we know they're KiB.
655 2005-08-07:
656         * mogstored: new config syntax and command line options