libpurple/util.c

   1 /* Purple is the legal property of its developers, whose names are too numerous
   2  * to list here.  Please refer to the COPYRIGHT file distributed with this
   3  * source distribution.
   4  *
   5  * This program is free software; you can redistribute it and/or modify
   6  * it under the terms of the GNU General Public License as published by
   7  * the Free Software Foundation; either version 2 of the License, or
   8  * (at your option) any later version.
   9  *
  10  * This program is distributed in the hope that it will be useful,
  11  * but WITHOUT ANY WARRANTY; without even the implied warranty of
  12  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
  13  * GNU General Public License for more details.
  14  *
  15  * You should have received a copy of the GNU General Public License
  16  * along with this program; if not, write to the Free Software
  17  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA  02111-1301  USA
  18  */
  19 #include "internal.h"
  20
  21 #include "conversation.h"
  22 #include "core.h"
  23 #include "debug.h"
  24 #include "glibcompat.h"
  25 #include "notify.h"
  26 #include "protocol.h"
  27 #include "prefs.h"
  28 #include "util.h"
  29
  30 #include <json-glib/json-glib.h>
  31
  32 static char *custom_user_dir = NULL;
  33 static char *user_dir = NULL;
  34 static gchar *cache_dir = NULL;
  35 static gchar *config_dir = NULL;
  36 static gchar *data_dir = NULL;
  37
  38 static JsonNode *escape_js_node = NULL;
  39 static JsonGenerator *escape_js_gen = NULL;
  40
  41 void
  42 purple_util_init(void)
  43 {
  44         escape_js_node = json_node_new(JSON_NODE_VALUE);
  45         escape_js_gen = json_generator_new();
  46         json_node_set_boolean(escape_js_node, FALSE);
  47 }
  48
  49 void
  50 purple_util_uninit(void)
  51 {
  52         /* Free these so we don't have leaks at shutdown. */
  53
  54         g_free(custom_user_dir);
  55         custom_user_dir = NULL;
  56
  57         g_free(user_dir);
  58         user_dir = NULL;
  59
  60         g_free(cache_dir);
  61         cache_dir = NULL;
  62
  63         g_free(config_dir);
  64         config_dir = NULL;
  65
  66         g_free(data_dir);
  67         data_dir = NULL;
  68
  69         json_node_free(escape_js_node);
  70         escape_js_node = NULL;
  71
  72         g_object_unref(escape_js_gen);
  73         escape_js_gen = NULL;
  74 }
  75
  76 /**************************************************************************
  77  * Base16 Functions
  78  **************************************************************************/
  79 gchar *
  80 purple_base16_encode(const guchar *data, gsize len)
  81 {
  82         gsize i;
  83         gchar *ascii = NULL;
  84
  85         g_return_val_if_fail(data != NULL, NULL);
  86         g_return_val_if_fail(len > 0,   NULL);
  87
  88         ascii = g_malloc(len * 2 + 1);
  89
  90         for (i = 0; i < len; i++)
  91                 g_snprintf(&ascii[i * 2], 3, "%02x", data[i] & 0xFF);
  92
  93         return ascii;
  94 }
  95
  96 guchar *
  97 purple_base16_decode(const char *str, gsize *ret_len)
  98 {
  99         gsize len, i, accumulator = 0;
 100         guchar *data;
 101
 102         g_return_val_if_fail(str != NULL, NULL);
 103
 104         len = strlen(str);
 105
 106         g_return_val_if_fail(*str, 0);
 107         g_return_val_if_fail(len % 2 == 0,    0);
 108
 109         data = g_malloc(len / 2);
 110
 111         for (i = 0; i < len; i++)
 112         {
 113                 if ((i % 2) == 0)
 114                         accumulator = 0;
 115                 else
 116                         accumulator <<= 4;
 117
 118                 if (isdigit(str[i]))
 119                         accumulator |= str[i] - 48;
 120                 else
 121                 {
 122                         switch(tolower(str[i]))
 123                         {
 124                                 case 'a':  accumulator |= 10;  break;
 125                                 case 'b':  accumulator |= 11;  break;
 126                                 case 'c':  accumulator |= 12;  break;
 127                                 case 'd':  accumulator |= 13;  break;
 128                                 case 'e':  accumulator |= 14;  break;
 129                                 case 'f':  accumulator |= 15;  break;
 130                         }
 131                 }
 132
 133                 if (i % 2)
 134                         data[(i - 1) / 2] = accumulator;
 135         }
 136
 137         if (ret_len != NULL)
 138                 *ret_len = len / 2;
 139
 140         return data;
 141 }
 142
 143 gchar *
 144 purple_base16_encode_chunked(const guchar *data, gsize len)
 145 {
 146         gsize i;
 147         gchar *ascii = NULL;
 148
 149         g_return_val_if_fail(data != NULL, NULL);
 150         g_return_val_if_fail(len > 0,   NULL);
 151
 152         /* For each byte of input, we need 2 bytes for the hex representation
 153          * and 1 for the colon.
 154          * The final colon will be replaced by a terminating NULL
 155          */
 156         ascii = g_malloc(len * 3 + 1);
 157
 158         for (i = 0; i < len; i++)
 159                 g_snprintf(&ascii[i * 3], 4, "%02x:", data[i] & 0xFF);
 160
 161         /* Replace the final colon with NULL */
 162         ascii[len * 3 - 1] = 0;
 163
 164         return ascii;
 165 }
 166
 167 /**************************************************************************
 168  * Date/Time Functions
 169  **************************************************************************/
 170
 171 const char *
 172 purple_utf8_strftime(const char *format, const struct tm *tm)
 173 {
 174         static char buf[128];
 175         GDateTime *dt;
 176         char *utf8;
 177
 178         g_return_val_if_fail(format != NULL, NULL);
 179
 180         if (tm == NULL)
 181         {
 182                 dt = g_date_time_new_now_local();
 183         } else {
 184                 dt = g_date_time_new_local(tm->tm_year + 1900, tm->tm_mon + 1,
 185                                 tm->tm_mday, tm->tm_hour,
 186                                 tm->tm_min, tm->tm_sec);
 187         }
 188
 189         utf8 = g_date_time_format(dt, format);
 190         g_date_time_unref(dt);
 191
 192         if (utf8 == NULL) {
 193                 purple_debug_error("util",
 194                                 "purple_utf8_strftime(): Formatting failed\n");
 195                 return "";
 196         }
 197
 198         g_strlcpy(buf, utf8, sizeof(buf));
 199         g_free(utf8);
 200         return buf;
 201 }
 202
 203 const char *
 204 purple_date_format_short(const struct tm *tm)
 205 {
 206         return purple_utf8_strftime("%x", tm);
 207 }
 208
 209 const char *
 210 purple_date_format_long(const struct tm *tm)
 211 {
 212         /*
 213          * This string determines how some dates are displayed.  The default
 214          * string "%x %X" shows the date then the time.  Translators can
 215          * change this to "%X %x" if they want the time to be shown first,
 216          * followed by the date.
 217          */
 218         return purple_utf8_strftime(_("%x %X"), tm);
 219 }
 220
 221 const char *
 222 purple_date_format_full(const struct tm *tm)
 223 {
 224         return purple_utf8_strftime("%c", tm);
 225 }
 226
 227 const char *
 228 purple_time_format(const struct tm *tm)
 229 {
 230         return purple_utf8_strftime("%X", tm);
 231 }
 232
 233 time_t
 234 purple_time_build(int year, int month, int day, int hour, int min, int sec)
 235 {
 236         struct tm tm;
 237
 238         tm.tm_year = year - 1900;
 239         tm.tm_mon = month - 1;
 240         tm.tm_mday = day;
 241         tm.tm_hour = hour;
 242         tm.tm_min = min;
 243         tm.tm_sec = sec >= 0 ? sec : time(NULL) % 60;
 244
 245         return mktime(&tm);
 246 }
 247
 248 /* originally taken from GLib trunk 1-6-11 */
 249 /* originally licensed as LGPL 2+ */
 250 static time_t
 251 mktime_utc(struct tm *tm)
 252 {
 253         time_t retval;
 254
 255 #ifndef HAVE_TIMEGM
 256         static const gint days_before[] =
 257         {
 258                 0, 31, 59, 90, 120, 151, 181, 212, 243, 273, 304, 334
 259         };
 260 #endif
 261
 262 #ifndef HAVE_TIMEGM
 263         if (tm->tm_mon < 0 || tm->tm_mon > 11)
 264                 return (time_t) -1;
 265
 266         retval = (tm->tm_year - 70) * 365;
 267         retval += (tm->tm_year - 68) / 4;
 268         retval += days_before[tm->tm_mon] + tm->tm_mday - 1;
 269
 270         if (tm->tm_year % 4 == 0 && tm->tm_mon < 2)
 271                 retval -= 1;
 272
 273         retval = ((((retval * 24) + tm->tm_hour) * 60) + tm->tm_min) * 60 + tm->tm_sec;
 274 #else
 275         retval = timegm (tm);
 276 #endif /* !HAVE_TIMEGM */
 277
 278         return retval;
 279 }
 280
 281 time_t
 282 purple_str_to_time(const char *timestamp, gboolean utc,
 283         struct tm *tm, long *tz_off, const char **rest)
 284 {
 285         struct tm t;
 286         const gchar *str;
 287         gint year = 0;
 288         long tzoff = PURPLE_NO_TZ_OFF;
 289         time_t retval;
 290         gboolean mktime_with_utc = FALSE;
 291
 292         if (rest != NULL)
 293                 *rest = NULL;
 294
 295         g_return_val_if_fail(timestamp != NULL, 0);
 296
 297         memset(&t, 0, sizeof(struct tm));
 298
 299         str = timestamp;
 300
 301         /* Strip leading whitespace */
 302         while (g_ascii_isspace(*str))
 303                 str++;
 304
 305         if (*str == '\0') {
 306                 if (rest != NULL && *str != '\0')
 307                         *rest = str;
 308
 309                 return 0;
 310         }
 311
 312         if (!g_ascii_isdigit(*str) && *str != '-' && *str != '+') {
 313                 if (rest != NULL && *str != '\0')
 314                         *rest = str;
 315
 316                 return 0;
 317         }
 318
 319         /* 4 digit year */
 320         if (sscanf(str, "%04d", &year) && year >= 1900) {
 321                 str += 4;
 322
 323                 if (*str == '-' || *str == '/')
 324                         str++;
 325
 326                 t.tm_year = year - 1900;
 327         }
 328
 329         /* 2 digit month */
 330         if (!sscanf(str, "%02d", &t.tm_mon)) {
 331                 if (rest != NULL && *str != '\0')
 332                         *rest = str;
 333
 334                 return 0;
 335         }
 336
 337         str += 2;
 338         t.tm_mon -= 1;
 339
 340         if (*str == '-' || *str == '/')
 341                 str++;
 342
 343         /* 2 digit day */
 344         if (!sscanf(str, "%02d", &t.tm_mday)) {
 345                 if (rest != NULL && *str != '\0')
 346                         *rest = str;
 347
 348                 return 0;
 349         }
 350
 351         str += 2;
 352
 353         /* Grab the year off the end if there's still stuff */
 354         if (*str == '/' || *str == '-') {
 355                 /* But make sure we don't read the year twice */
 356                 if (year >= 1900) {
 357                         if (rest != NULL && *str != '\0')
 358                                 *rest = str;
 359
 360                         return 0;
 361                 }
 362
 363                 str++;
 364
 365                 if (!sscanf(str, "%04d", &t.tm_year)) {
 366                         if (rest != NULL && *str != '\0')
 367                                 *rest = str;
 368
 369                         return 0;
 370                 }
 371
 372                 t.tm_year -= 1900;
 373         } else if (*str == 'T' || *str == '.') {
 374                 str++;
 375
 376                 /* Continue grabbing the hours/minutes/seconds */
 377                 if ((sscanf(str, "%02d:%02d:%02d", &t.tm_hour, &t.tm_min, &t.tm_sec) == 3 &&
 378                                 (str += 8)) ||
 379                     (sscanf(str, "%02d%02d%02d", &t.tm_hour, &t.tm_min, &t.tm_sec) == 3 &&
 380                                 (str += 6)))
 381                 {
 382                         gint sign, tzhrs, tzmins;
 383
 384                         if (*str == '.') {
 385                                 /* Cut off those pesky micro-seconds */
 386                                 do {
 387                                         str++;
 388                                 } while (*str >= '0' && *str <= '9');
 389                         }
 390
 391                         sign = (*str == '+') ? 1 : -1;
 392
 393                         /* Process the timezone */
 394                         if (*str == '+' || *str == '-') {
 395                                 str++;
 396
 397                                 if (((sscanf(str, "%02d:%02d", &tzhrs, &tzmins) == 2 && (str += 5)) ||
 398                                         (sscanf(str, "%02d%02d", &tzhrs, &tzmins) == 2 && (str += 4))))
 399                                 {
 400                                         mktime_with_utc = TRUE;
 401                                         tzoff = tzhrs * 60 * 60 + tzmins * 60;
 402                                         tzoff *= sign;
 403                                 }
 404                         } else if (*str == 'Z') {
 405                                 /* 'Z' = Zulu = UTC */
 406                                 str++;
 407                                 mktime_with_utc = TRUE;
 408                                 tzoff = 0;
 409                         }
 410
 411                         if (!mktime_with_utc)
 412                         {
 413                                 /* No timezone specified. */
 414
 415                                 if (utc) {
 416                                         mktime_with_utc = TRUE;
 417                                         tzoff = 0;
 418                                 } else {
 419                                         /* Local Time */
 420                                         t.tm_isdst = -1;
 421                                 }
 422                         }
 423                 }
 424         }
 425
 426         if (rest != NULL && *str != '\0') {
 427                 /* Strip trailing whitespace */
 428                 while (g_ascii_isspace(*str))
 429                         str++;
 430
 431                 if (*str != '\0')
 432                         *rest = str;
 433         }
 434
 435         if (mktime_with_utc)
 436                 retval = mktime_utc(&t);
 437         else
 438                 retval = mktime(&t);
 439
 440         if (tm != NULL)
 441                 *tm = t;
 442
 443         if (tzoff != PURPLE_NO_TZ_OFF)
 444                 retval -= tzoff;
 445
 446         if (tz_off != NULL)
 447                 *tz_off = tzoff;
 448
 449         return retval;
 450 }
 451
 452 GDateTime *
 453 purple_str_to_date_time(const char *timestamp, gboolean utc)
 454 {
 455         const gchar *str;
 456         gint year = 0;
 457         gint month = 0;
 458         gint day = 0;
 459         gint hour = 0;
 460         gint minute = 0;
 461         gint seconds = 0;
 462         gint microseconds = 0;
 463         int chars = 0;
 464         GTimeZone *tz = NULL;
 465         GDateTime *retval;
 466
 467         g_return_val_if_fail(timestamp != NULL, NULL);
 468
 469         str = timestamp;
 470
 471         /* Strip leading whitespace */
 472         while (g_ascii_isspace(*str))
 473                 str++;
 474
 475         if (*str == '\0') {
 476                 return NULL;
 477         }
 478
 479         if (!g_ascii_isdigit(*str) && *str != '-' && *str != '+') {
 480                 return NULL;
 481         }
 482
 483         /* 4 digit year */
 484         if (sscanf(str, "%04d", &year) && year > 0) {
 485                 str += 4;
 486
 487                 if (*str == '-' || *str == '/')
 488                         str++;
 489         }
 490
 491         /* 2 digit month */
 492         if (!sscanf(str, "%02d", &month)) {
 493                 return NULL;
 494         }
 495
 496         str += 2;
 497
 498         if (*str == '-' || *str == '/')
 499                 str++;
 500
 501         /* 2 digit day */
 502         if (!sscanf(str, "%02d", &day)) {
 503                 return NULL;
 504         }
 505
 506         str += 2;
 507
 508         /* Grab the year off the end if there's still stuff */
 509         if (*str == '/' || *str == '-') {
 510                 /* But make sure we don't read the year twice */
 511                 if (year > 0) {
 512                         return NULL;
 513                 }
 514
 515                 str++;
 516
 517                 if (!sscanf(str, "%04d", &year)) {
 518                         return NULL;
 519                 }
 520         } else if (*str == 'T' || *str == '.') {
 521                 str++;
 522
 523                 /* Continue grabbing the hours/minutes/seconds */
 524                 if ((sscanf(str, "%02d:%02d:%02d", &hour, &minute, &seconds) == 3 &&
 525                                 (str += 8)) ||
 526                     (sscanf(str, "%02d%02d%02d", &hour, &minute, &seconds) == 3 &&
 527                                 (str += 6)))
 528                 {
 529                         if (*str == '.') {
 530                                 str++;
 531                                 if (sscanf(str, "%d%n", &microseconds, &chars) == 1) {
 532                                         str += chars;
 533                                 }
 534                         }
 535
 536                         if (*str) {
 537                                 const gchar *end = str;
 538                                 if (*end == '+' || *end == '-') {
 539                                         end++;
 540                                 }
 541
 542                                 while (isdigit(*end) || *end == ':') {
 543                                         end++;
 544                                 }
 545
 546                                 if (str != end) {
 547                                         /* Trim anything trailing a purely numeric time zone. */
 548                                         gchar *tzstr = g_strndup(str, end - str);
 549                                         tz = g_time_zone_new(tzstr);
 550                                         g_free(tzstr);
 551                                 } else {
 552                                         /* Just try whatever is there. */
 553                                         tz = g_time_zone_new(str);
 554                                 }
 555                         }
 556                 }
 557         }
 558
 559         if (!tz) {
 560                 /* No timezone specified. */
 561                 if (utc) {
 562                         tz = g_time_zone_new_utc();
 563                 } else {
 564                         tz = g_time_zone_new_local();
 565                 }
 566         }
 567
 568         retval = g_date_time_new(tz, year, month, day, hour, minute,
 569                                  seconds + microseconds * pow(10, -chars));
 570         g_time_zone_unref(tz);
 571
 572         return retval;
 573 }
 574
 575 char *
 576 purple_uts35_to_str(const char *format, size_t len, struct tm *tm)
 577 {
 578         GString *string;
 579         guint i, count;
 580
 581         if (tm == NULL) {
 582                 time_t now = time(NULL);
 583                 tm = localtime(&now);
 584         }
 585
 586         string = g_string_sized_new(len);
 587         i = 0;
 588         while (i < len) {
 589                 count = 1;
 590                 while ((i + count) < len && format[i] == format[i+count])
 591                         count++;
 592
 593                 switch (format[i]) {
 594                         /* Era Designator */
 595                         case 'G':
 596                                 if (count <= 3) {
 597                                         /* Abbreviated */
 598                                 } else if (count == 4) {
 599                                         /* Full */
 600                                 } else if (count >= 5) {
 601                                         /* Narrow */
 602                                         count = 5;
 603                                 }
 604                                 break;
 605
 606
 607                         /* Year */
 608                         case 'y':
 609                                 if (count == 2) {
 610                                         /* Two-digits only */
 611                                         g_string_append(string, purple_utf8_strftime("%y", tm));
 612                                 } else {
 613                                         /* Zero-padding */
 614                                         g_string_append_printf(string, "%0*d",
 615                                                         count,
 616                                                         tm->tm_year + 1900);
 617                                 }
 618                                 break;
 619
 620                         /* Year (in "Week of Year" based calendars) */
 621                         case 'Y':
 622                                 if (count == 2) {
 623                                         /* Two-digits only */
 624                                 } else {
 625                                         /* Zero-padding */
 626                                 }
 627                                 break;
 628
 629                         /* Extended Year */
 630                         case 'u':
 631                                 break;
 632
 633                         /* Cyclic Year Name */
 634                         case 'U':
 635                                 if (count <= 3) {
 636                                         /* Abbreviated */
 637                                 } else if (count == 4) {
 638                                         /* Full */
 639                                 } else if (count >= 5) {
 640                                         /* Narrow */
 641                                         count = 5;
 642                                 }
 643                                 break;
 644
 645
 646                         /* Quarter */
 647                         case 'Q':
 648                                 if (count <= 2) {
 649                                         /* Numerical */
 650                                 } else if (count == 3) {
 651                                         /* Abbreviation */
 652                                 } else if (count >= 4) {
 653                                         /* Full */
 654                                         count = 4;
 655                                 }
 656                                 break;
 657
 658                         /* Stand-alone Quarter */
 659                         case 'q':
 660                                 if (count <= 2) {
 661                                         /* Numerical */
 662                                 } else if (count == 3) {
 663                                         /* Abbreviation */
 664                                 } else if (count >= 4) {
 665                                         /* Full */
 666                                         count = 4;
 667                                 }
 668                                 break;
 669
 670                         /* Month */
 671                         case 'M':
 672                                 if (count <= 2) {
 673                                         /* Numerical */
 674                                         g_string_append(string, purple_utf8_strftime("%m", tm));
 675                                 } else if (count == 3) {
 676                                         /* Abbreviation */
 677                                         g_string_append(string, purple_utf8_strftime("%b", tm));
 678                                 } else if (count == 4) {
 679                                         /* Full */
 680                                         g_string_append(string, purple_utf8_strftime("%B", tm));
 681                                 } else if (count >= 5) {
 682                                         g_string_append_len(string, purple_utf8_strftime("%b", tm), 1);
 683                                         count = 5;
 684                                 }
 685                                 break;
 686
 687                         /* Stand-alone Month */
 688                         case 'L':
 689                                 if (count <= 2) {
 690                                         /* Numerical */
 691                                         g_string_append(string, purple_utf8_strftime("%m", tm));
 692                                 } else if (count == 3) {
 693                                         /* Abbreviation */
 694                                         g_string_append(string, purple_utf8_strftime("%b", tm));
 695                                 } else if (count == 4) {
 696                                         /* Full */
 697                                         g_string_append(string, purple_utf8_strftime("%B", tm));
 698                                 } else if (count >= 5) {
 699                                         g_string_append_len(string, purple_utf8_strftime("%b", tm), 1);
 700                                         count = 5;
 701                                 }
 702                                 break;
 703
 704                         /* Ignored */
 705                         case 'l':
 706                                 break;
 707
 708
 709                         /* Week of Year */
 710                         case 'w':
 711                                 g_string_append(string, purple_utf8_strftime("%W", tm));
 712                                 count = MIN(count, 2);
 713                                 break;
 714
 715                         /* Week of Month */
 716                         case 'W':
 717                                 count = 1;
 718                                 break;
 719
 720
 721                         /* Day of Month */
 722                         case 'd':
 723                                 g_string_append(string, purple_utf8_strftime("%d", tm));
 724                                 count = MIN(count, 2);
 725                                 break;
 726
 727                         /* Day of Year */
 728                         case 'D':
 729                                 g_string_append(string, purple_utf8_strftime("%j", tm));
 730                                 count = MIN(count, 3);
 731                                 break;
 732
 733                         /* Day of Year in Month */
 734                         case 'F':
 735                                 count = 1;
 736                                 break;
 737
 738                         /* Modified Julian Day */
 739                         case 'g':
 740                                 break;
 741
 742
 743                         /* Day of Week */
 744                         case 'E':
 745                                 if (count <= 3) {
 746                                         /* Short */
 747                                         g_string_append(string, purple_utf8_strftime("%a", tm));
 748                                 } else if (count == 4) {
 749                                         /* Full */
 750                                         g_string_append(string, purple_utf8_strftime("%A", tm));
 751                                 } else if (count >= 5) {
 752                                         /* Narrow */
 753                                         g_string_append_len(string, purple_utf8_strftime("%a", tm), 1);
 754                                         count = 5;
 755                                 }
 756                                 break;
 757
 758                         /* Local Day of Week */
 759                         case 'e':
 760                                 if (count <= 2) {
 761                                         /* Numeric */
 762                                         g_string_append(string, purple_utf8_strftime("%u", tm));
 763                                 } else if (count == 3) {
 764                                         /* Short */
 765                                         g_string_append(string, purple_utf8_strftime("%a", tm));
 766                                 } else if (count == 4) {
 767                                         /* Full */
 768                                         g_string_append(string, purple_utf8_strftime("%A", tm));
 769                                 } else if (count >= 5) {
 770                                         /* Narrow */
 771                                         g_string_append_len(string, purple_utf8_strftime("%a", tm), 1);
 772                                         count = 5;
 773                                 }
 774                                 break;
 775
 776                         /* Stand-alone Local Day of Week */
 777                         case 'c':
 778                                 if (count <= 2) {
 779                                         /* Numeric */
 780                                         g_string_append(string, purple_utf8_strftime("%u", tm));
 781                                         count = 1;
 782                                 } else if (count == 3) {
 783                                         /* Short */
 784                                         g_string_append(string, purple_utf8_strftime("%a", tm));
 785                                 } else if (count == 4) {
 786                                         /* Full */
 787                                         g_string_append(string, purple_utf8_strftime("%A", tm));
 788                                 } else if (count >= 5) {
 789                                         /* Narrow */
 790                                         g_string_append_len(string, purple_utf8_strftime("%a", tm), 1);
 791                                         count = 5;
 792                                 }
 793                                 break;
 794
 795
 796                         /* AM/PM */
 797                         case 'a':
 798                                 g_string_append(string, purple_utf8_strftime("%p", tm));
 799                                 break;
 800
 801
 802                         /* Hour (1-12) */
 803                         case 'h':
 804                                 if (count == 1) {
 805                                         /* No padding */
 806                                         g_string_append(string, purple_utf8_strftime("%I", tm));
 807                                 } else if (count >= 2) {
 808                                         /* Zero-padded */
 809                                         g_string_append(string, purple_utf8_strftime("%I", tm));
 810                                         count = 2;
 811                                 }
 812                                 break;
 813
 814                         /* Hour (0-23) */
 815                         case 'H':
 816                                 if (count == 1) {
 817                                         /* No padding */
 818                                         g_string_append(string, purple_utf8_strftime("%H", tm));
 819                                 } else if (count >= 2) {
 820                                         /* Zero-padded */
 821                                         g_string_append(string, purple_utf8_strftime("%H", tm));
 822                                         count = 2;
 823                                 }
 824                                 break;
 825
 826                         /* Hour (0-11) */
 827                         case 'K':
 828                                 if (count == 1) {
 829                                         /* No padding */
 830                                 } else if (count >= 2) {
 831                                         /* Zero-padded */
 832                                         count = 2;
 833                                 }
 834                                 break;
 835
 836                         /* Hour (1-24) */
 837                         case 'k':
 838                                 if (count == 1) {
 839                                         /* No padding */
 840                                 } else if (count >= 2) {
 841                                         /* Zero-padded */
 842                                         count = 2;
 843                                 }
 844                                 break;
 845
 846                         /* Hour (hHkK by locale) */
 847                         case 'j':
 848                                 break;
 849
 850
 851                         /* Minute */
 852                         case 'm':
 853                                 g_string_append(string, purple_utf8_strftime("%M", tm));
 854                                 count = MIN(count, 2);
 855                                 break;
 856
 857
 858                         /* Second */
 859                         case 's':
 860                                 g_string_append(string, purple_utf8_strftime("%S", tm));
 861                                 count = MIN(count, 2);
 862                                 break;
 863
 864                         /* Fractional Sub-second */
 865                         case 'S':
 866                                 break;
 867
 868                         /* Millisecond */
 869                         case 'A':
 870                                 break;
 871
 872
 873                         /* Time Zone (specific non-location format) */
 874                         case 'z':
 875                                 if (count <= 3) {
 876                                         /* Short */
 877                                 } else if (count >= 4) {
 878                                         /* Full */
 879                                         count = 4;
 880                                 }
 881                                 break;
 882
 883                         /* Time Zone */
 884                         case 'Z':
 885                                 if (count <= 3) {
 886                                         /* RFC822 */
 887                                         g_string_append(string, purple_utf8_strftime("%z", tm));
 888                                 } else if (count == 4) {
 889                                         /* Localized GMT */
 890                                 } else if (count >= 5) {
 891                                         /* ISO8601 */
 892                                         g_string_append(string, purple_utf8_strftime("%z", tm));
 893                                         count = 5;
 894                                 }
 895                                 break;
 896
 897                         /* Time Zone (generic non-location format) */
 898                         case 'v':
 899                                 if (count <= 3) {
 900                                         /* Short */
 901                                         g_string_append(string, purple_utf8_strftime("%Z", tm));
 902                                         count = 1;
 903                                 } else if (count >= 4) {
 904                                         /* Long */
 905                                         g_string_append(string, purple_utf8_strftime("%Z", tm));
 906                                         count = 4;
 907                                 }
 908                                 break;
 909
 910                         /* Time Zone */
 911                         case 'V':
 912                                 if (count <= 3) {
 913                                         /* Same as z */
 914                                         count = 1;
 915                                 } else if (count >= 4) {
 916                                         /* Generic Location Format) */
 917                                         g_string_append(string, purple_utf8_strftime("%Z", tm));
 918                                         count = 4;
 919                                 }
 920                                 break;
 921
 922
 923                         default:
 924                                 g_string_append_len(string, format + i, count);
 925                                 break;
 926                 }
 927
 928                 i += count;
 929         }
 930
 931         return g_string_free(string, FALSE);
 932 }
 933
 934
 935 /**************************************************************************
 936  * Markup Functions
 937  **************************************************************************/
 938
 939 /*
 940  * This function is stolen from glib's gmarkup.c and modified to not
 941  * replace ' with &apos;
 942  */
 943 static void append_escaped_text(GString *str,
 944                 const gchar *text, gssize length)
 945 {
 946         const gchar *p;
 947         const gchar *end;
 948         gunichar c;
 949
 950         p = text;
 951         end = text + length;
 952
 953         while (p != end)
 954         {
 955                 const gchar *next;
 956                 next = g_utf8_next_char (p);
 957
 958                 switch (*p)
 959                 {
 960                         case '&':
 961                                 g_string_append (str, "&amp;");
 962                                 break;
 963
 964                         case '<':
 965                                 g_string_append (str, "&lt;");
 966                                 break;
 967
 968                         case '>':
 969                                 g_string_append (str, "&gt;");
 970                                 break;
 971
 972                         case '"':
 973                                 g_string_append (str, "&quot;");
 974                                 break;
 975
 976                         default:
 977                                 c = g_utf8_get_char (p);
 978                                 if ((0x1 <= c && c <= 0x8) ||
 979                                                 (0xb <= c && c <= 0xc) ||
 980                                                 (0xe <= c && c <= 0x1f) ||
 981                                                 (0x7f <= c && c <= 0x84) ||
 982                                                 (0x86 <= c && c <= 0x9f))
 983                                         g_string_append_printf (str, "&#x%x;", c);
 984                                 else
 985                                         g_string_append_len (str, p, next - p);
 986                                 break;
 987                 }
 988
 989                 p = next;
 990         }
 991 }
 992
 993 /* This function is stolen from glib's gmarkup.c */
 994 gchar *purple_markup_escape_text(const gchar *text, gssize length)
 995 {
 996         GString *str;
 997
 998         g_return_val_if_fail(text != NULL, NULL);
 999
1000         if (length < 0)
1001                 length = strlen(text);
1002
1003         /* prealloc at least as long as original text */
1004         str = g_string_sized_new(length);
1005         append_escaped_text(str, text, length);
1006
1007         return g_string_free(str, FALSE);
1008 }
1009
1010 const char *
1011 purple_markup_unescape_entity(const char *text, int *length)
1012 {
1013         const char *pln;
1014         int len;
1015
1016         if (!text || *text != '&')
1017                 return NULL;
1018
1019 #define IS_ENTITY(s)  (!g_ascii_strncasecmp(text, s, (len = sizeof(s) - 1)))
1020
1021         if(IS_ENTITY("&amp;"))
1022                 pln = "&";
1023         else if(IS_ENTITY("&lt;"))
1024                 pln = "<";
1025         else if(IS_ENTITY("&gt;"))
1026                 pln = ">";
1027         else if(IS_ENTITY("&nbsp;"))
1028                 pln = " ";
1029         else if(IS_ENTITY("&copy;"))
1030                 pln = "\302\251";      /* or use g_unichar_to_utf8(0xa9); */
1031         else if(IS_ENTITY("&quot;"))
1032                 pln = "\"";
1033         else if(IS_ENTITY("&reg;"))
1034                 pln = "\302\256";      /* or use g_unichar_to_utf8(0xae); */
1035         else if(IS_ENTITY("&apos;"))
1036                 pln = "\'";
1037         else if(text[1] == '#' && (g_ascii_isxdigit(text[2]) || text[2] == 'x')) {
1038                 static char buf[7];
1039                 const char *start = text + 2;
1040                 char *end;
1041                 guint64 pound;
1042                 int base = 10;
1043                 int buflen;
1044
1045                 if (*start == 'x') {
1046                         base = 16;
1047                         start++;
1048                 }
1049
1050                 pound = g_ascii_strtoull(start, &end, base);
1051                 if (pound == 0 || pound > INT_MAX || *end != ';') {
1052                         return NULL;
1053                 }
1054
1055                 len = (end - text) + 1;
1056
1057                 buflen = g_unichar_to_utf8((gunichar)pound, buf);
1058                 buf[buflen] = '\0';
1059                 pln = buf;
1060         }
1061         else
1062                 return NULL;
1063
1064         if (length)
1065                 *length = len;
1066         return pln;
1067 }
1068
1069 char *
1070 purple_markup_get_css_property(const gchar *style,
1071                                 const gchar *opt)
1072 {
1073         const gchar *css_str = style;
1074         const gchar *css_value_start;
1075         const gchar *css_value_end;
1076         gchar *tmp;
1077         gchar *ret;
1078
1079         g_return_val_if_fail(opt != NULL, NULL);
1080
1081         if (!css_str)
1082                 return NULL;
1083
1084         /* find the CSS property */
1085         while (1)
1086         {
1087                 /* skip whitespace characters */
1088                 while (*css_str && g_ascii_isspace(*css_str))
1089                         css_str++;
1090                 if (!g_ascii_isalpha(*css_str))
1091                         return NULL;
1092                 if (g_ascii_strncasecmp(css_str, opt, strlen(opt)))
1093                 {
1094                         /* go to next css property positioned after the next ';' */
1095                         while (*css_str && *css_str != '"' && *css_str != ';')
1096                                 css_str++;
1097                         if(*css_str != ';')
1098                                 return NULL;
1099                         css_str++;
1100                 }
1101                 else
1102                         break;
1103         }
1104
1105         /* find the CSS value position in the string */
1106         css_str += strlen(opt);
1107         while (*css_str && g_ascii_isspace(*css_str))
1108                 css_str++;
1109         if (*css_str != ':')
1110                 return NULL;
1111         css_str++;
1112         while (*css_str && g_ascii_isspace(*css_str))
1113                 css_str++;
1114         if (*css_str == '\0' || *css_str == '"' || *css_str == ';')
1115                 return NULL;
1116
1117         /* mark the CSS value */
1118         css_value_start = css_str;
1119         while (*css_str && *css_str != '"' && *css_str != ';')
1120                 css_str++;
1121         css_value_end = css_str - 1;
1122
1123         /* Removes trailing whitespace */
1124         while (css_value_end > css_value_start && g_ascii_isspace(*css_value_end))
1125                 css_value_end--;
1126
1127         tmp = g_strndup(css_value_start, css_value_end - css_value_start + 1);
1128         ret = purple_unescape_html(tmp);
1129         g_free(tmp);
1130
1131         return ret;
1132 }
1133
1134 gboolean purple_markup_is_rtl(const char *html)
1135 {
1136         GData *attributes;
1137         const gchar *start, *end;
1138         gboolean res = FALSE;
1139
1140         if (purple_markup_find_tag("span", html, &start, &end, &attributes))
1141         {
1142                 /* tmp is a member of attributes and is free with g_datalist_clear call */
1143                 const char *tmp = g_datalist_get_data(&attributes, "dir");
1144                 if (tmp && !g_ascii_strcasecmp(tmp, "RTL"))
1145                         res = TRUE;
1146                 if (!res)
1147                 {
1148                         tmp = g_datalist_get_data(&attributes, "style");
1149                         if (tmp)
1150                         {
1151                                 char *tmp2 = purple_markup_get_css_property(tmp, "direction");
1152                                 if (tmp2 && !g_ascii_strcasecmp(tmp2, "RTL"))
1153                                         res = TRUE;
1154                                 g_free(tmp2);
1155                         }
1156
1157                 }
1158                 g_datalist_clear(&attributes);
1159         }
1160         return res;
1161 }
1162
1163 gboolean
1164 purple_markup_find_tag(const char *needle, const char *haystack,
1165                                          const char **start, const char **end, GData **attributes)
1166 {
1167         GData *attribs;
1168         const char *cur = haystack;
1169         char *name = NULL;
1170         gboolean found = FALSE;
1171         gboolean in_tag = FALSE;
1172         gboolean in_attr = FALSE;
1173         const char *in_quotes = NULL;
1174         size_t needlelen;
1175
1176         g_return_val_if_fail(    needle != NULL, FALSE);
1177         g_return_val_if_fail(   *needle != '\0', FALSE);
1178         g_return_val_if_fail(  haystack != NULL, FALSE);
1179         g_return_val_if_fail(     start != NULL, FALSE);
1180         g_return_val_if_fail(       end != NULL, FALSE);
1181         g_return_val_if_fail(attributes != NULL, FALSE);
1182
1183         needlelen = strlen(needle);
1184         g_datalist_init(&attribs);
1185
1186         while (*cur && !found) {
1187                 if (in_tag) {
1188                         if (in_quotes) {
1189                                 const char *close = cur;
1190
1191                                 while (*close && *close != *in_quotes)
1192                                         close++;
1193
1194                                 /* if we got the close quote, store the value and carry on from    *
1195                                  * after it. if we ran to the end of the string, point to the NULL *
1196                                  * and we're outta here */
1197                                 if (*close) {
1198                                         /* only store a value if we have an attribute name */
1199                                         if (name) {
1200                                                 size_t len = close - cur;
1201                                                 char *val = g_strndup(cur, len);
1202
1203                                                 g_datalist_set_data_full(&attribs, name, val, g_free);
1204                                                 g_free(name);
1205                                                 name = NULL;
1206                                         }
1207
1208                                         in_quotes = NULL;
1209                                         cur = close + 1;
1210                                 } else {
1211                                         cur = close;
1212                                 }
1213                         } else if (in_attr) {
1214                                 const char *close = cur;
1215
1216                                 while (*close && *close != '>' && *close != '"' &&
1217                                                 *close != '\'' && *close != ' ' && *close != '=')
1218                                         close++;
1219
1220                                 /* if we got the equals, store the name of the attribute. if we got
1221                                  * the quote, save the attribute and go straight to quote mode.
1222                                  * otherwise the tag closed or we reached the end of the string,
1223                                  * so we can get outta here */
1224                                 switch (*close) {
1225                                 case '"':
1226                                 case '\'':
1227                                         in_quotes = close;
1228                                         /* fall through */
1229                                 case '=':
1230                                         {
1231                                                 size_t len = close - cur;
1232
1233                                                 /* don't store a blank attribute name */
1234                                                 if (len) {
1235                                                         g_free(name);
1236                                                         name = g_ascii_strdown(cur, len);
1237                                                 }
1238
1239                                                 in_attr = FALSE;
1240                                                 cur = close + 1;
1241                                         }
1242                                         break;
1243                                 case ' ':
1244                                 case '>':
1245                                         in_attr = FALSE;
1246                                         /* fall through */
1247                                 default:
1248                                         cur = close;
1249                                         break;
1250                                 }
1251                         } else {
1252                                 switch (*cur) {
1253                                 case ' ':
1254                                         /* swallow extra spaces inside tag */
1255                                         while (*cur && *cur == ' ') cur++;
1256                                         in_attr = TRUE;
1257                                         break;
1258                                 case '>':
1259                                         found = TRUE;
1260                                         *end = cur;
1261                                         break;
1262                                 case '"':
1263                                 case '\'':
1264                                         in_quotes = cur;
1265                                         /* fall through */
1266                                 default:
1267                                         cur++;
1268                                         break;
1269                                 }
1270                         }
1271                 } else {
1272                         /* if we hit a < followed by the name of our tag... */
1273                         if (*cur == '<' && !g_ascii_strncasecmp(cur + 1, needle, needlelen)) {
1274                                 *start = cur;
1275                                 cur = cur + needlelen + 1;
1276
1277                                 /* if we're pointing at a space or a >, we found the right tag. if *
1278                                  * we're not, we've found a longer tag, so we need to skip to the  *
1279                                  * >, but not being distracted by >s inside quotes.                */
1280                                 if (*cur == ' ' || *cur == '>') {
1281                                         in_tag = TRUE;
1282                                 } else {
1283                                         while (*cur && *cur != '"' && *cur != '\'' && *cur != '>') {
1284                                                 if (*cur == '"') {
1285                                                         cur++;
1286                                                         while (*cur && *cur != '"')
1287                                                                 cur++;
1288                                                 } else if (*cur == '\'') {
1289                                                         cur++;
1290                                                         while (*cur && *cur != '\'')
1291                                                                 cur++;
1292                                                 } else {
1293                                                         cur++;
1294                                                 }
1295                                         }
1296                                 }
1297                         } else {
1298                                 cur++;
1299                         }
1300                 }
1301         }
1302
1303         /* clean up any attribute name from a premature termination */
1304         g_free(name);
1305
1306         if (found) {
1307                 *attributes = attribs;
1308         } else {
1309                 *start = NULL;
1310                 *end = NULL;
1311                 *attributes = NULL;
1312         }
1313
1314         return found;
1315 }
1316
1317 gboolean
1318 purple_markup_extract_info_field(const char *str, int len, PurpleNotifyUserInfo *user_info,
1319                                                            const char *start_token, int skip,
1320                                                            const char *end_token, char check_value,
1321                                                            const char *no_value_token,
1322                                                            const char *display_name, gboolean is_link,
1323                                                            const char *link_prefix,
1324                                                            PurpleInfoFieldFormatCallback format_cb)
1325 {
1326         const char *p, *q;
1327
1328         g_return_val_if_fail(str          != NULL, FALSE);
1329         g_return_val_if_fail(user_info    != NULL, FALSE);
1330         g_return_val_if_fail(start_token  != NULL, FALSE);
1331         g_return_val_if_fail(end_token    != NULL, FALSE);
1332         g_return_val_if_fail(display_name != NULL, FALSE);
1333
1334         p = strstr(str, start_token);
1335
1336         if (p == NULL)
1337                 return FALSE;
1338
1339         p += strlen(start_token) + skip;
1340
1341         if (p >= str + len)
1342                 return FALSE;
1343
1344         if (check_value != '\0' && *p == check_value)
1345                 return FALSE;
1346
1347         q = strstr(p, end_token);
1348
1349         /* Trim leading blanks */
1350         while (*p != '\n' && g_ascii_isspace(*p)) {
1351                 p += 1;
1352         }
1353
1354         /* Trim trailing blanks */
1355         while (q > p && g_ascii_isspace(*(q - 1))) {
1356                 q -= 1;
1357         }
1358
1359         /* Don't bother with null strings */
1360         if (p == q)
1361                 return FALSE;
1362
1363         if (q != NULL && (!no_value_token ||
1364                                           (no_value_token && strncmp(p, no_value_token,
1365                                                                                                  strlen(no_value_token)))))
1366         {
1367                 GString *dest = g_string_new("");
1368
1369                 if (is_link)
1370                 {
1371                         g_string_append(dest, "<a href=\"");
1372
1373                         if (link_prefix)
1374                                 g_string_append(dest, link_prefix);
1375
1376                         if (format_cb != NULL)
1377                         {
1378                                 char *reformatted = format_cb(p, q - p);
1379                                 g_string_append(dest, reformatted);
1380                                 g_free(reformatted);
1381                         }
1382                         else
1383                                 g_string_append_len(dest, p, q - p);
1384                         g_string_append(dest, "\">");
1385
1386                         if (link_prefix)
1387                                 g_string_append(dest, link_prefix);
1388
1389                         g_string_append_len(dest, p, q - p);
1390                         g_string_append(dest, "</a>");
1391                 }
1392                 else
1393                 {
1394                         if (format_cb != NULL)
1395                         {
1396                                 char *reformatted = format_cb(p, q - p);
1397                                 g_string_append(dest, reformatted);
1398                                 g_free(reformatted);
1399                         }
1400                         else
1401                                 g_string_append_len(dest, p, q - p);
1402                 }
1403
1404                 purple_notify_user_info_add_pair_html(user_info, display_name, dest->str);
1405                 g_string_free(dest, TRUE);
1406
1407                 return TRUE;
1408         }
1409
1410         return FALSE;
1411 }
1412
1413 struct purple_parse_tag {
1414         char *src_tag;
1415         char *dest_tag;
1416         gboolean ignore;
1417 };
1418
1419 /* NOTE: Do not put `do {} while(0)` around this macro (as this is the method
1420          recommended in the GCC docs). It contains 'continue's that should
1421          affect the while-loop in purple_markup_html_to_xhtml and doing the
1422          above would break that.
1423          Also, remember to put braces in constructs that require them for
1424          multiple statements when using this macro. */
1425 #define ALLOW_TAG_ALT(x, y) if(!g_ascii_strncasecmp(c, "<" x " ", strlen("<" x " "))) { \
1426                                                 const char *o = c + strlen("<" x); \
1427                                                 const char *p = NULL, *q = NULL, *r = NULL; \
1428                                                 /* o = iterating over full tag \
1429                                                  * p = > (end of tag) \
1430                                                  * q = start of quoted bit \
1431                                                  * r = < inside tag \
1432                                                  */ \
1433                                                 GString *innards = g_string_new(""); \
1434                                                 while(o && *o) { \
1435                                                         if(!q && (*o == '\"' || *o == '\'') ) { \
1436                                                                 q = o; \
1437                                                         } else if(q) { \
1438                                                                 if(*o == *q) { /* end of quoted bit */ \
1439                                                                         char *unescaped = g_strndup(q+1, o-q-1); \
1440                                                                         char *escaped = g_markup_escape_text(unescaped, -1); \
1441                                                                         g_string_append_printf(innards, "%c%s%c", *q, escaped, *q); \
1442                                                                         g_free(unescaped); \
1443                                                                         g_free(escaped); \
1444                                                                         q = NULL; \
1445                                                                 } else if(*c == '\\') { \
1446                                                                         o++; \
1447                                                                 } \
1448                                                         } else if(*o == '<') { \
1449                                                                 r = o; \
1450                                                         } else if(*o == '>') { \
1451                                                                 p = o; \
1452                                                                 break; \
1453                                                         } else { \
1454                                                                 innards = g_string_append_c(innards, *o); \
1455                                                         } \
1456                                                         o++; \
1457                                                 } \
1458                                                 if(p && !r) { /* got an end of tag and no other < earlier */\
1459                                                         if(*(p-1) != '/') { \
1460                                                                 struct purple_parse_tag *pt = g_new0(struct purple_parse_tag, 1); \
1461                                                                 pt->src_tag = x; \
1462                                                                 pt->dest_tag = y; \
1463                                                                 tags = g_list_prepend(tags, pt); \
1464                                                         } \
1465                                                         if(xhtml) { \
1466                                                                 xhtml = g_string_append(xhtml, "<" y); \
1467                                                                 xhtml = g_string_append(xhtml, innards->str); \
1468                                                                 xhtml = g_string_append_c(xhtml, '>'); \
1469                                                         } \
1470                                                         c = p + 1; \
1471                                                 } else { /* got end of tag with earlier < *or* didn't get anything */ \
1472                                                         if(xhtml) \
1473                                                                 xhtml = g_string_append(xhtml, "&lt;"); \
1474                                                         if(plain) \
1475                                                                 plain = g_string_append_c(plain, '<'); \
1476                                                         c++; \
1477                                                 } \
1478                                                 g_string_free(innards, TRUE); \
1479                                                 continue; \
1480                                         } \
1481                                         if(!g_ascii_strncasecmp(c, "<" x, strlen("<" x)) && \
1482                                                         (*(c+strlen("<" x)) == '>' || \
1483                                                          !g_ascii_strncasecmp(c+strlen("<" x), "/>", 2))) { \
1484                                                 if(xhtml) \
1485                                                         xhtml = g_string_append(xhtml, "<" y); \
1486                                                 c += strlen("<" x); \
1487                                                 if(*c != '/') { \
1488                                                         struct purple_parse_tag *pt = g_new0(struct purple_parse_tag, 1); \
1489                                                         pt->src_tag = x; \
1490                                                         pt->dest_tag = y; \
1491                                                         tags = g_list_prepend(tags, pt); \
1492                                                         if(xhtml) \
1493                                                                 xhtml = g_string_append_c(xhtml, '>'); \
1494                                                 } else { \
1495                                                         if(xhtml) \
1496                                                                 xhtml = g_string_append(xhtml, "/>");\
1497                                                 } \
1498                                                 c = strchr(c, '>') + 1; \
1499                                                 continue; \
1500                                         }
1501 /* Don't forget to check the note above for ALLOW_TAG_ALT. */
1502 #define ALLOW_TAG(x) ALLOW_TAG_ALT(x, x)
1503 void
1504 purple_markup_html_to_xhtml(const char *html, char **xhtml_out,
1505                                                   char **plain_out)
1506 {
1507         GString *xhtml = NULL;
1508         GString *plain = NULL;
1509         GString *url = NULL;
1510         GString *cdata = NULL;
1511         GList *tags = NULL, *tag;
1512         const char *c = html;
1513         char quote = '\0';
1514
1515 #define CHECK_QUOTE(ptr) if (*(ptr) == '\'' || *(ptr) == '\"') \
1516                         quote = *(ptr++); \
1517                 else \
1518                         quote = '\0';
1519
1520 #define VALID_CHAR(ptr) (*(ptr) && *(ptr) != quote && (quote || (*(ptr) != ' ' && *(ptr) != '>')))
1521
1522         g_return_if_fail(xhtml_out != NULL || plain_out != NULL);
1523
1524         if(xhtml_out)
1525                 xhtml = g_string_new("");
1526         if(plain_out)
1527                 plain = g_string_new("");
1528
1529         while(c && *c) {
1530                 if(*c == '<') {
1531                         if(*(c+1) == '/') { /* closing tag */
1532                                 tag = tags;
1533                                 while(tag) {
1534                                         struct purple_parse_tag *pt = tag->data;
1535                                         if(!g_ascii_strncasecmp((c+2), pt->src_tag, strlen(pt->src_tag)) && *(c+strlen(pt->src_tag)+2) == '>') {
1536                                                 c += strlen(pt->src_tag) + 3;
1537                                                 break;
1538                                         }
1539                                         tag = tag->next;
1540                                 }
1541                                 if(tag) {
1542                                         while(tags) {
1543                                                 struct purple_parse_tag *pt = tags->data;
1544                                                 if(xhtml && !pt->ignore)
1545                                                         g_string_append_printf(xhtml, "</%s>", pt->dest_tag);
1546                                                 if(plain && purple_strequal(pt->src_tag, "a")) {
1547                                                         /* if this is a link, we have to add the url to the plaintext, too */
1548                                                         if (cdata && url &&
1549                                                                         (!g_string_equal(cdata, url) && (g_ascii_strncasecmp(url->str, "mailto:", 7) != 0 ||
1550                                                                                                          g_utf8_collate(url->str + 7, cdata->str) != 0)))
1551                                                                         g_string_append_printf(plain, " <%s>", g_strstrip(purple_unescape_html(url->str)));
1552                                                         if (cdata) {
1553                                                                 g_string_free(cdata, TRUE);
1554                                                                 cdata = NULL;
1555                                                         }
1556
1557                                                 }
1558                                                 if(tags == tag)
1559                                                         break;
1560                                                 tags = g_list_remove(tags, pt);
1561                                                 g_free(pt);
1562                                         }
1563                                         g_free(tag->data);
1564                                         tags = g_list_delete_link(tags, tag);
1565                                 } else {
1566                                         /* a closing tag we weren't expecting...
1567                                          * we'll let it slide, if it's really a tag...if it's
1568                                          * just a </ we'll escape it properly */
1569                                         const char *end = c+2;
1570                                         while(*end && g_ascii_isalpha(*end))
1571                                                 end++;
1572                                         if(*end == '>') {
1573                                                 c = end+1;
1574                                         } else {
1575                                                 if(xhtml)
1576                                                         xhtml = g_string_append(xhtml, "&lt;");
1577                                                 if(plain)
1578                                                         plain = g_string_append_c(plain, '<');
1579                                                 c++;
1580                                         }
1581                                 }
1582                         } else { /* opening tag */
1583                                 ALLOW_TAG("blockquote");
1584                                 ALLOW_TAG("cite");
1585                                 ALLOW_TAG("div");
1586                                 ALLOW_TAG("em");
1587                                 ALLOW_TAG("h1");
1588                                 ALLOW_TAG("h2");
1589                                 ALLOW_TAG("h3");
1590                                 ALLOW_TAG("h4");
1591                                 ALLOW_TAG("h5");
1592                                 ALLOW_TAG("h6");
1593                                 /* we only allow html to start the message */
1594                                 if(c == html) {
1595                                         ALLOW_TAG("html");
1596                                 }
1597                                 ALLOW_TAG_ALT("i", "em");
1598                                 ALLOW_TAG_ALT("italic", "em");
1599                                 ALLOW_TAG("li");
1600                                 ALLOW_TAG("ol");
1601                                 ALLOW_TAG("p");
1602                                 ALLOW_TAG("pre");
1603                                 ALLOW_TAG("q");
1604                                 ALLOW_TAG("span");
1605                                 ALLOW_TAG("ul");
1606
1607
1608                                 /* we skip <HR> because it's not legal in XHTML-IM.  However,
1609                                  * we still want to send something sensible, so we put a
1610                                  * linebreak in its place. <BR> also needs special handling
1611                                  * because putting a </BR> to close it would just be dumb. */
1612                                 if((!g_ascii_strncasecmp(c, "<br", 3)
1613                                                         || !g_ascii_strncasecmp(c, "<hr", 3))
1614                                                 && (*(c+3) == '>' ||
1615                                                         !g_ascii_strncasecmp(c+3, "/>", 2) ||
1616                                                         !g_ascii_strncasecmp(c+3, " />", 3))) {
1617                                         c = strchr(c, '>') + 1;
1618                                         if(xhtml)
1619                                                 xhtml = g_string_append(xhtml, "<br/>");
1620                                         if(plain && *c != '\n')
1621                                                 plain = g_string_append_c(plain, '\n');
1622                                         continue;
1623                                 }
1624                                 if(!g_ascii_strncasecmp(c, "<b>", 3) || !g_ascii_strncasecmp(c, "<bold>", strlen("<bold>")) || !g_ascii_strncasecmp(c, "<strong>", strlen("<strong>"))) {
1625                                         struct purple_parse_tag *pt = g_new0(struct purple_parse_tag, 1);
1626                                         if (*(c+2) == '>')
1627                                                 pt->src_tag = "b";
1628                                         else if (*(c+2) == 'o')
1629                                                 pt->src_tag = "bold";
1630                                         else
1631                                                 pt->src_tag = "strong";
1632                                         pt->dest_tag = "span";
1633                                         tags = g_list_prepend(tags, pt);
1634                                         c = strchr(c, '>') + 1;
1635                                         if(xhtml)
1636                                                 xhtml = g_string_append(xhtml, "<span style='font-weight: bold;'>");
1637                                         continue;
1638                                 }
1639                                 if(!g_ascii_strncasecmp(c, "<u>", 3) || !g_ascii_strncasecmp(c, "<underline>", strlen("<underline>"))) {
1640                                         struct purple_parse_tag *pt = g_new0(struct purple_parse_tag, 1);
1641                                         pt->src_tag = *(c+2) == '>' ? "u" : "underline";
1642                                         pt->dest_tag = "span";
1643                                         tags = g_list_prepend(tags, pt);
1644                                         c = strchr(c, '>') + 1;
1645                                         if (xhtml)
1646                                                 xhtml = g_string_append(xhtml, "<span style='text-decoration: underline;'>");
1647                                         continue;
1648                                 }
1649                                 if(!g_ascii_strncasecmp(c, "<s>", 3) || !g_ascii_strncasecmp(c, "<strike>", strlen("<strike>"))) {
1650                                         struct purple_parse_tag *pt = g_new0(struct purple_parse_tag, 1);
1651                                         pt->src_tag = *(c+2) == '>' ? "s" : "strike";
1652                                         pt->dest_tag = "span";
1653                                         tags = g_list_prepend(tags, pt);
1654                                         c = strchr(c, '>') + 1;
1655                                         if(xhtml)
1656                                                 xhtml = g_string_append(xhtml, "<span style='text-decoration: line-through;'>");
1657                                         continue;
1658                                 }
1659                                 if(!g_ascii_strncasecmp(c, "<sub>", 5)) {
1660                                         struct purple_parse_tag *pt = g_new0(struct purple_parse_tag, 1);
1661                                         pt->src_tag = "sub";
1662                                         pt->dest_tag = "span";
1663                                         tags = g_list_prepend(tags, pt);
1664                                         c = strchr(c, '>') + 1;
1665                                         if(xhtml)
1666                                                 xhtml = g_string_append(xhtml, "<span style='vertical-align:sub;'>");
1667                                         continue;
1668                                 }
1669                                 if(!g_ascii_strncasecmp(c, "<sup>", 5)) {
1670                                         struct purple_parse_tag *pt = g_new0(struct purple_parse_tag, 1);
1671                                         pt->src_tag = "sup";
1672                                         pt->dest_tag = "span";
1673                                         tags = g_list_prepend(tags, pt);
1674                                         c = strchr(c, '>') + 1;
1675                                         if(xhtml)
1676                                                 xhtml = g_string_append(xhtml, "<span style='vertical-align:super;'>");
1677                                         continue;
1678                                 }
1679                                 if (!g_ascii_strncasecmp(c, "<img", 4) && (*(c+4) == '>' || *(c+4) == ' ')) {
1680                                         const char *p = c + 4;
1681                                         GString *src = NULL, *alt = NULL;
1682 #define ESCAPE(from, to)        \
1683                 CHECK_QUOTE(from); \
1684                 while (VALID_CHAR(from)) { \
1685                         int len; \
1686                         if ((*from == '&') && (purple_markup_unescape_entity(from, &len) == NULL)) \
1687                                 to = g_string_append(to, "&amp;"); \
1688                         else if (*from == '\'') \
1689                                 to = g_string_append(to, "&apos;"); \
1690                         else \
1691                                 to = g_string_append_c(to, *from); \
1692                         from++; \
1693                 }
1694
1695                                         while (*p && *p != '>') {
1696                                                 if (!g_ascii_strncasecmp(p, "src=", 4)) {
1697                                                         const char *q = p + 4;
1698                                                         if (src)
1699                                                                 g_string_free(src, TRUE);
1700                                                         src = g_string_new("");
1701                                                         ESCAPE(q, src);
1702                                                         p = q;
1703                                                 } else if (!g_ascii_strncasecmp(p, "alt=", 4)) {
1704                                                         const char *q = p + 4;
1705                                                         if (alt)
1706                                                                 g_string_free(alt, TRUE);
1707                                                         alt = g_string_new("");
1708                                                         ESCAPE(q, alt);
1709                                                         p = q;
1710                                                 } else {
1711                                                         p++;
1712                                                 }
1713                                         }
1714 #undef ESCAPE
1715                                         if ((c = strchr(p, '>')) != NULL)
1716                                                 c++;
1717                                         else
1718                                                 c = p;
1719                                         /* src and alt are required! */
1720                                         if(src && xhtml)
1721                                                 g_string_append_printf(xhtml, "<img src='%s' alt='%s' />", g_strstrip(src->str), alt ? alt->str : "");
1722                                         if(alt) {
1723                                                 if(plain)
1724                                                         plain = g_string_append(plain, purple_unescape_html(alt->str));
1725                                                 if(!src && xhtml)
1726                                                         xhtml = g_string_append(xhtml, alt->str);
1727                                                 g_string_free(alt, TRUE);
1728                                         }
1729                                         g_string_free(src, TRUE);
1730                                         continue;
1731                                 }
1732                                 if (!g_ascii_strncasecmp(c, "<a", 2) && (*(c+2) == '>' || *(c+2) == ' ')) {
1733                                         const char *p = c + 2;
1734                                         struct purple_parse_tag *pt;
1735                                         while (*p && *p != '>') {
1736                                                 if (!g_ascii_strncasecmp(p, "href=", 5)) {
1737                                                         const char *q = p + 5;
1738                                                         if (url)
1739                                                                 g_string_free(url, TRUE);
1740                                                         url = g_string_new("");
1741                                                         if (cdata)
1742                                                                 g_string_free(cdata, TRUE);
1743                                                         cdata = g_string_new("");
1744                                                         CHECK_QUOTE(q);
1745                                                         while (VALID_CHAR(q)) {
1746                                                                 int len;
1747                                                                 if ((*q == '&') && (purple_markup_unescape_entity(q, &len) == NULL))
1748                                                                         url = g_string_append(url, "&amp;");
1749                                                                 else if (*q == '"')
1750                                                                         url = g_string_append(url, "&quot;");
1751                                                                 else
1752                                                                         url = g_string_append_c(url, *q);
1753                                                                 q++;
1754                                                         }
1755                                                         p = q;
1756                                                 } else {
1757                                                         p++;
1758                                                 }
1759                                         }
1760                                         if ((c = strchr(p, '>')) != NULL)
1761                                                 c++;
1762                                         else
1763                                                 c = p;
1764                                         pt = g_new0(struct purple_parse_tag, 1);
1765                                         pt->src_tag = "a";
1766                                         pt->dest_tag = "a";
1767                                         tags = g_list_prepend(tags, pt);
1768                                         if(xhtml)
1769                                                 g_string_append_printf(xhtml, "<a href=\"%s\">", url ? g_strstrip(url->str) : "");
1770                                         continue;
1771                                 }
1772 #define ESCAPE(from, to)        \
1773                 CHECK_QUOTE(from); \
1774                 while (VALID_CHAR(from)) { \
1775                         int len; \
1776                         if ((*from == '&') && (purple_markup_unescape_entity(from, &len) == NULL)) \
1777                                 to = g_string_append(to, "&amp;"); \
1778                         else if (*from == '\'') \
1779                                 to = g_string_append_c(to, '\"'); \
1780                         else \
1781                                 to = g_string_append_c(to, *from); \
1782                         from++; \
1783                 }
1784                                 if(!g_ascii_strncasecmp(c, "<font", 5) && (*(c+5) == '>' || *(c+5) == ' ')) {
1785                                         const char *p = c + 5;
1786                                         GString *style = g_string_new("");
1787                                         struct purple_parse_tag *pt;
1788                                         while (*p && *p != '>') {
1789                                                 if (!g_ascii_strncasecmp(p, "back=", 5)) {
1790                                                         const char *q = p + 5;
1791                                                         GString *color = g_string_new("");
1792                                                         ESCAPE(q, color);
1793                                                         g_string_append_printf(style, "background: %s; ", color->str);
1794                                                         g_string_free(color, TRUE);
1795                                                         p = q;
1796                                                 } else if (!g_ascii_strncasecmp(p, "color=", 6)) {
1797                                                         const char *q = p + 6;
1798                                                         GString *color = g_string_new("");
1799                                                         ESCAPE(q, color);
1800                                                         g_string_append_printf(style, "color: %s; ", color->str);
1801                                                         g_string_free(color, TRUE);
1802                                                         p = q;
1803                                                 } else if (!g_ascii_strncasecmp(p, "face=", 5)) {
1804                                                         const char *q = p + 5;
1805                                                         GString *face = g_string_new("");
1806                                                         ESCAPE(q, face);
1807                                                         g_string_append_printf(style, "font-family: %s; ", g_strstrip(face->str));
1808                                                         g_string_free(face, TRUE);
1809                                                         p = q;
1810                                                 } else if (!g_ascii_strncasecmp(p, "size=", 5)) {
1811                                                         const char *q = p + 5;
1812                                                         int sz;
1813                                                         const char *size = "medium";
1814                                                         CHECK_QUOTE(q);
1815                                                         sz = atoi(q);
1816                                                         switch (sz)
1817                                                         {
1818                                                         case 1:
1819                                                           size = "xx-small";
1820                                                           break;
1821                                                         case 2:
1822                                                           size = "small";
1823                                                           break;
1824                                                         case 3:
1825                                                           size = "medium";
1826                                                           break;
1827                                                         case 4:
1828                                                           size = "large";
1829                                                           break;
1830                                                         case 5:
1831                                                           size = "x-large";
1832                                                           break;
1833                                                         case 6:
1834                                                         case 7:
1835                                                           size = "xx-large";
1836                                                           break;
1837                                                         default:
1838                                                           break;
1839                                                         }
1840                                                         g_string_append_printf(style, "font-size: %s; ", size);
1841                                                         p = q;
1842                                                 } else {
1843                                                         p++;
1844                                                 }
1845                                         }
1846                                         if ((c = strchr(p, '>')) != NULL)
1847                                                 c++;
1848                                         else
1849                                                 c = p;
1850                                         pt = g_new0(struct purple_parse_tag, 1);
1851                                         pt->src_tag = "font";
1852                                         pt->dest_tag = "span";
1853                                         tags = g_list_prepend(tags, pt);
1854                                         if(style->len && xhtml)
1855                                                 g_string_append_printf(xhtml, "<span style='%s'>", g_strstrip(style->str));
1856                                         else
1857                                                 pt->ignore = TRUE;
1858                                         g_string_free(style, TRUE);
1859                                         continue;
1860                                 }
1861 #undef ESCAPE
1862                                 if (!g_ascii_strncasecmp(c, "<body ", 6)) {
1863                                         const char *p = c + 6;
1864                                         gboolean did_something = FALSE;
1865                                         while (*p && *p != '>') {
1866                                                 if (!g_ascii_strncasecmp(p, "bgcolor=", 8)) {
1867                                                         const char *q = p + 8;
1868                                                         struct purple_parse_tag *pt = g_new0(struct purple_parse_tag, 1);
1869                                                         GString *color = g_string_new("");
1870                                                         CHECK_QUOTE(q);
1871                                                         while (VALID_CHAR(q)) {
1872                                                                 color = g_string_append_c(color, *q);
1873                                                                 q++;
1874                                                         }
1875                                                         if (xhtml)
1876                                                                 g_string_append_printf(xhtml, "<span style='background: %s;'>", g_strstrip(color->str));
1877                                                         g_string_free(color, TRUE);
1878                                                         if ((c = strchr(p, '>')) != NULL)
1879                                                                 c++;
1880                                                         else
1881                                                                 c = p;
1882                                                         pt->src_tag = "body";
1883                                                         pt->dest_tag = "span";
1884                                                         tags = g_list_prepend(tags, pt);
1885                                                         did_something = TRUE;
1886                                                         break;
1887                                                 }
1888                                                 p++;
1889                                         }
1890                                         if (did_something) continue;
1891                                 }
1892                                 /* this has to come after the special case for bgcolor */
1893                                 ALLOW_TAG("body");
1894                                 if(!g_ascii_strncasecmp(c, "<!--", strlen("<!--"))) {
1895                                         char *p = strstr(c + strlen("<!--"), "-->");
1896                                         if(p) {
1897                                                 if(xhtml)
1898                                                         xhtml = g_string_append(xhtml, "<!--");
1899                                                 c += strlen("<!--");
1900                                                 continue;
1901                                         }
1902                                 }
1903
1904                                 if(xhtml)
1905                                         xhtml = g_string_append(xhtml, "&lt;");
1906                                 if(plain)
1907                                         plain = g_string_append_c(plain, '<');
1908                                 c++;
1909                         }
1910                 } else if(*c == '&') {
1911                         char buf[7];
1912                         const char *pln;
1913                         int len;
1914
1915                         if ((pln = purple_markup_unescape_entity(c, &len)) == NULL) {
1916                                 len = 1;
1917                                 g_snprintf(buf, sizeof(buf), "%c", *c);
1918                                 pln = buf;
1919                         }
1920                         if(xhtml)
1921                                 xhtml = g_string_append_len(xhtml, c, len);
1922                         if(plain)
1923                                 plain = g_string_append(plain, pln);
1924                         if(cdata)
1925                                 cdata = g_string_append_len(cdata, c, len);
1926                         c += len;
1927                 } else {
1928                         if(xhtml)
1929                                 xhtml = g_string_append_c(xhtml, *c);
1930                         if(plain)
1931                                 plain = g_string_append_c(plain, *c);
1932                         if(cdata)
1933                                 cdata = g_string_append_c(cdata, *c);
1934                         c++;
1935                 }
1936         }
1937         if(xhtml) {
1938                 for (tag = tags; tag ; tag = tag->next) {
1939                         struct purple_parse_tag *pt = tag->data;
1940                         if(!pt->ignore)
1941                                 g_string_append_printf(xhtml, "</%s>", pt->dest_tag);
1942                 }
1943         }
1944         g_list_free(tags);
1945         if(xhtml_out)
1946                 *xhtml_out = g_string_free(xhtml, FALSE);
1947         if(plain_out)
1948                 *plain_out = g_string_free(plain, FALSE);
1949         if(url)
1950                 g_string_free(url, TRUE);
1951         if (cdata)
1952                 g_string_free(cdata, TRUE);
1953 #undef CHECK_QUOTE
1954 #undef VALID_CHAR
1955 }
1956
1957 /* The following are probably reasonable changes:
1958  * - \n should be converted to a normal space
1959  * - in addition to <br>, <p> and <div> etc. should also be converted into \n
1960  * - We want to turn </td>#whitespace<td> sequences into a single tab
1961  * - We want to turn </tr>#whitespace<tr> sequences into a single \n
1962  * - <script>...</script> and <style>...</style> should be completely removed
1963  */
1964
1965 char *
1966 purple_markup_strip_html(const char *str)
1967 {
1968         int i, j, k, entlen;
1969         gboolean visible = TRUE;
1970         gboolean closing_td_p = FALSE;
1971         gchar *str2;
1972         const gchar *cdata_close_tag = NULL, *ent;
1973         gchar *href = NULL;
1974         int href_st = 0;
1975
1976         if(!str)
1977                 return NULL;
1978
1979         str2 = g_strdup(str);
1980
1981         for (i = 0, j = 0; str2[i]; i++)
1982         {
1983                 if (str2[i] == '<')
1984                 {
1985                         if (cdata_close_tag)
1986                         {
1987                                 /* Note: Don't even assume any other tag is a tag in CDATA */
1988                                 if (g_ascii_strncasecmp(str2 + i, cdata_close_tag,
1989                                                 strlen(cdata_close_tag)) == 0)
1990                                 {
1991                                         i += strlen(cdata_close_tag) - 1;
1992                                         cdata_close_tag = NULL;
1993                                 }
1994                                 continue;
1995                         }
1996                         else if (g_ascii_strncasecmp(str2 + i, "<td", 3) == 0 && closing_td_p)
1997                         {
1998                                 str2[j++] = '\t';
1999                                 visible = TRUE;
2000                         }
2001                         else if (g_ascii_strncasecmp(str2 + i, "</td>", 5) == 0)
2002                         {
2003                                 closing_td_p = TRUE;
2004                                 visible = FALSE;
2005                         }
2006                         else
2007                         {
2008                                 closing_td_p = FALSE;
2009                                 visible = TRUE;
2010                         }
2011
2012                         k = i + 1;
2013
2014                         if(g_ascii_isspace(str2[k]))
2015                                 visible = TRUE;
2016                         else if (str2[k])
2017                         {
2018                                 /* Scan until we end the tag either implicitly (closed start
2019                                  * tag) or explicitly, using a sloppy method (i.e., < or >
2020                                  * inside quoted attributes will screw us up)
2021                                  */
2022                                 while (str2[k] && str2[k] != '<' && str2[k] != '>')
2023                                 {
2024                                         k++;
2025                                 }
2026
2027                                 /* If we've got an <a> tag with an href, save the address
2028                                  * to print later. */
2029                                 if (g_ascii_strncasecmp(str2 + i, "<a", 2) == 0 &&
2030                                     g_ascii_isspace(str2[i+2]))
2031                                 {
2032                                         int st; /* start of href, inclusive [ */
2033                                         int end; /* end of href, exclusive ) */
2034                                         char delim = ' ';
2035                                         /* Find start of href */
2036                                         for (st = i + 3; st < k; st++)
2037                                         {
2038                                                 if (g_ascii_strncasecmp(str2+st, "href=", 5) == 0)
2039                                                 {
2040                                                         st += 5;
2041                                                         if (str2[st] == '"' || str2[st] == '\'')
2042                                                         {
2043                                                                 delim = str2[st];
2044                                                                 st++;
2045                                                         }
2046                                                         break;
2047                                                 }
2048                                         }
2049                                         /* find end of address */
2050                                         for (end = st; end < k && str2[end] != delim; end++)
2051                                         {
2052                                                 /* All the work is done in the loop construct above. */
2053                                         }
2054
2055                                         /* If there's an address, save it.  If there was
2056                                          * already one saved, kill it. */
2057                                         if (st < k)
2058                                         {
2059                                                 char *tmp;
2060                                                 g_free(href);
2061                                                 tmp = g_strndup(str2 + st, end - st);
2062                                                 href = purple_unescape_html(tmp);
2063                                                 g_free(tmp);
2064                                                 href_st = j;
2065                                         }
2066                                 }
2067
2068                                 /* Replace </a> with an ascii representation of the
2069                                  * address the link was pointing to. */
2070                                 else if (href != NULL && g_ascii_strncasecmp(str2 + i, "</a>", 4) == 0)
2071                                 {
2072                                         size_t hrlen = strlen(href);
2073
2074                                         /* Only insert the href if it's different from the CDATA. */
2075                                         if ((hrlen != (gsize)(j - href_st) ||
2076                                              strncmp(str2 + href_st, href, hrlen)) &&
2077                                             (hrlen != (gsize)(j - href_st + 7) || /* 7 == strlen("http://") */
2078                                              strncmp(str2 + href_st, href + 7, hrlen - 7)))
2079                                         {
2080                                                 str2[j++] = ' ';
2081                                                 str2[j++] = '(';
2082                                                 memmove(str2 + j, href, hrlen);
2083                                                 j += hrlen;
2084                                                 str2[j++] = ')';
2085                                                 g_free(href);
2086                                                 href = NULL;
2087                                         }
2088                                 }
2089
2090                                 /* Check for tags which should be mapped to newline (but ignore some of
2091                                  * the tags at the beginning of the text) */
2092                                 else if ((j && (g_ascii_strncasecmp(str2 + i, "<p>", 3) == 0
2093                                               || g_ascii_strncasecmp(str2 + i, "<tr", 3) == 0
2094                                               || g_ascii_strncasecmp(str2 + i, "<hr", 3) == 0
2095                                               || g_ascii_strncasecmp(str2 + i, "<li", 3) == 0
2096                                               || g_ascii_strncasecmp(str2 + i, "<div", 4) == 0))
2097                                  || g_ascii_strncasecmp(str2 + i, "<br", 3) == 0
2098                                  || g_ascii_strncasecmp(str2 + i, "</table>", 8) == 0)
2099                                 {
2100                                         str2[j++] = '\n';
2101                                 }
2102                                 /* Check for tags which begin CDATA and need to be closed */
2103                                 else if (g_ascii_strncasecmp(str2 + i, "<script", 7) == 0)
2104                                 {
2105                                         cdata_close_tag = "</script>";
2106                                 }
2107                                 else if (g_ascii_strncasecmp(str2 + i, "<style", 6) == 0)
2108                                 {
2109                                         cdata_close_tag = "</style>";
2110                                 }
2111                                 /* Update the index and continue checking after the tag */
2112                                 i = (str2[k] == '<' || str2[k] == '\0')? k - 1: k;
2113                                 continue;
2114                         }
2115                 }
2116                 else if (cdata_close_tag)
2117                 {
2118                         continue;
2119                 }
2120                 else if (!g_ascii_isspace(str2[i]))
2121                 {
2122                         visible = TRUE;
2123                 }
2124
2125                 if (str2[i] == '&' && (ent = purple_markup_unescape_entity(str2 + i, &entlen)) != NULL)
2126                 {
2127                         while (*ent)
2128                                 str2[j++] = *ent++;
2129                         i += entlen - 1;
2130                         continue;
2131                 }
2132
2133                 if (visible)
2134                         str2[j++] = g_ascii_isspace(str2[i])? ' ': str2[i];
2135         }
2136
2137         g_free(href);
2138
2139         str2[j] = '\0';
2140
2141         return str2;
2142 }
2143
2144 static gboolean
2145 badchar(char c)
2146 {
2147         switch (c) {
2148         case ' ':
2149         case ',':
2150         case '\0':
2151         case '\n':
2152         case '\r':
2153         case '<':
2154         case '>':
2155         case '"':
2156                 return TRUE;
2157         default:
2158                 return FALSE;
2159         }
2160 }
2161
2162 static gboolean
2163 badentity(const char *c)
2164 {
2165         if (!g_ascii_strncasecmp(c, "&lt;", 4) ||
2166                 !g_ascii_strncasecmp(c, "&gt;", 4) ||
2167                 !g_ascii_strncasecmp(c, "&quot;", 6)) {
2168                 return TRUE;
2169         }
2170         return FALSE;
2171 }
2172
2173 static const char *
2174 process_link(GString *ret,
2175                 const char *start, const char *c,
2176                 int matchlen,
2177                 const char *urlprefix,
2178                 int inside_paren)
2179 {
2180         char *url_buf, *tmpurlbuf;
2181         const char *t;
2182
2183         for (t = c;; t++) {
2184                 if (!badchar(*t) && !badentity(t))
2185                         continue;
2186
2187                 if (t - c == matchlen)
2188                         break;
2189
2190                 if (*t == ',' && *(t + 1) != ' ') {
2191                         continue;
2192                 }
2193
2194                 if (t > start && *(t - 1) == '.')
2195                         t--;
2196                 if (t > start && *(t - 1) == ')' && inside_paren > 0)
2197                         t--;
2198
2199                 url_buf = g_strndup(c, t - c);
2200                 tmpurlbuf = purple_unescape_html(url_buf);
2201                 g_string_append_printf(ret, "<A HREF=\"%s%s\">%s</A>",
2202                                 urlprefix,
2203                                 tmpurlbuf, url_buf);
2204                 g_free(tmpurlbuf);
2205                 g_free(url_buf);
2206                 return t;
2207         }
2208
2209         return c;
2210 }
2211
2212 char *
2213 purple_markup_linkify(const char *text)
2214 {
2215         const char *c, *t, *q = NULL;
2216         char *tmpurlbuf, *url_buf;
2217         gunichar g;
2218         gboolean inside_html = FALSE;
2219         int inside_paren = 0;
2220         GString *ret;
2221
2222         if (text == NULL)
2223                 return NULL;
2224
2225         ret = g_string_new("");
2226
2227         c = text;
2228         while (*c) {
2229
2230                 if(*c == '(' && !inside_html) {
2231                         inside_paren++;
2232                         ret = g_string_append_c(ret, *c);
2233                         c++;
2234                 }
2235
2236                 if(inside_html) {
2237                         if(*c == '>') {
2238                                 inside_html = FALSE;
2239                         } else if(!q && (*c == '\"' || *c == '\'')) {
2240                                 q = c;
2241                         } else if(q) {
2242                                 if(*c == *q)
2243                                         q = NULL;
2244                         }
2245                 } else if(*c == '<') {
2246                         inside_html = TRUE;
2247                         if (!g_ascii_strncasecmp(c, "<A", 2)) {
2248                                 while (1) {
2249                                         if (!g_ascii_strncasecmp(c, "/A>", 3)) {
2250                                                 inside_html = FALSE;
2251                                                 break;
2252                                         }
2253                                         ret = g_string_append_c(ret, *c);
2254                                         c++;
2255                                         if (!(*c))
2256                                                 break;
2257                                 }
2258                         }
2259                 } else if (!g_ascii_strncasecmp(c, "http://", 7)) {
2260                         c = process_link(ret, text, c, 7, "", inside_paren);
2261                 } else if (!g_ascii_strncasecmp(c, "https://", 8)) {
2262                         c = process_link(ret, text, c, 8, "", inside_paren);
2263                 } else if (!g_ascii_strncasecmp(c, "ftp://", 6)) {
2264                         c = process_link(ret, text, c, 6, "", inside_paren);
2265                 } else if (!g_ascii_strncasecmp(c, "sftp://", 7)) {
2266                         c = process_link(ret, text, c, 7, "", inside_paren);
2267                 } else if (!g_ascii_strncasecmp(c, "file://", 7)) {
2268                         c = process_link(ret, text, c, 7, "", inside_paren);
2269                 } else if (!g_ascii_strncasecmp(c, "www.", 4) && c[4] != '.' && (c == text || badchar(c[-1]) || badentity(c-1))) {
2270                         c = process_link(ret, text, c, 4, "http://", inside_paren);
2271                 } else if (!g_ascii_strncasecmp(c, "ftp.", 4) && c[4] != '.' && (c == text || badchar(c[-1]) || badentity(c-1))) {
2272                         c = process_link(ret, text, c, 4, "ftp://", inside_paren);
2273                 } else if (!g_ascii_strncasecmp(c, "xmpp:", 5) && (c == text || badchar(c[-1]) || badentity(c-1))) {
2274                         c = process_link(ret, text, c, 5, "", inside_paren);
2275                 } else if (!g_ascii_strncasecmp(c, "mailto:", 7)) {
2276                         t = c;
2277                         while (1) {
2278                                 if (badchar(*t) || badentity(t)) {
2279                                         char *d;
2280                                         if (t - c == 7) {
2281                                                 break;
2282                                         }
2283                                         if (t > text && *(t - 1) == '.')
2284                                                 t--;
2285                                         if ((d = strstr(c + 7, "?")) != NULL && d < t)
2286                                                 url_buf = g_strndup(c + 7, d - c - 7);
2287                                         else
2288                                                 url_buf = g_strndup(c + 7, t - c - 7);
2289                                         if (!purple_email_is_valid(url_buf)) {
2290                                                 g_free(url_buf);
2291                                                 break;
2292                                         }
2293                                         g_free(url_buf);
2294                                         url_buf = g_strndup(c, t - c);
2295                                         tmpurlbuf = purple_unescape_html(url_buf);
2296                                         g_string_append_printf(ret, "<A HREF=\"%s\">%s</A>",
2297                                                           tmpurlbuf, url_buf);
2298                                         g_free(url_buf);
2299                                         g_free(tmpurlbuf);
2300                                         c = t;
2301                                         break;
2302                                 }
2303                                 t++;
2304                         }
2305                 } else if (c != text && (*c == '@')) {
2306                         int flag;
2307                         GString *gurl_buf = NULL;
2308                         const char illegal_chars[] = "!@#$%^&*()[]{}/|\\<>\":;\r\n \0";
2309
2310                         if (strchr(illegal_chars,*(c - 1)) || strchr(illegal_chars, *(c + 1)))
2311                                 flag = 0;
2312                         else {
2313                                 flag = 1;
2314                                 gurl_buf = g_string_new("");
2315                         }
2316
2317                         t = c;
2318                         while (flag) {
2319                                 /* iterate backwards grabbing the local part of an email address */
2320                                 g = g_utf8_get_char(t);
2321                                 if (badchar(*t) || (g >= 127) || (*t == '(') ||
2322                                         ((*t == ';') && ((t > (text+2) && (!g_ascii_strncasecmp(t - 3, "&lt;", 4) ||
2323                                                                        !g_ascii_strncasecmp(t - 3, "&gt;", 4))) ||
2324                                                      (t > (text+4) && (!g_ascii_strncasecmp(t - 5, "&quot;", 6)))))) {
2325                                         /* local part will already be part of ret, strip it out */
2326                                         ret = g_string_truncate(ret, ret->len - (c - t));
2327                                         ret = g_string_append_unichar(ret, g);
2328                                         break;
2329                                 } else {
2330                                         g_string_prepend_unichar(gurl_buf, g);
2331                                         t = g_utf8_find_prev_char(text, t);
2332                                         if (t < text) {
2333                                                 ret = g_string_assign(ret, "");
2334                                                 break;
2335                                         }
2336                                 }
2337                         }
2338
2339                         t = g_utf8_find_next_char(c, NULL);
2340
2341                         while (flag) {
2342                                 /* iterate forwards grabbing the domain part of an email address */
2343                                 g = g_utf8_get_char(t);
2344                                 if (badchar(*t) || (g >= 127) || (*t == ')') || badentity(t)) {
2345                                         char *d;
2346
2347                                         url_buf = g_string_free(gurl_buf, FALSE);
2348
2349                                         /* strip off trailing periods */
2350                                         if (*url_buf) {
2351                                                 for (d = url_buf + strlen(url_buf) - 1; *d == '.'; d--, t--)
2352                                                         *d = '\0';
2353                                         }
2354
2355                                         tmpurlbuf = purple_unescape_html(url_buf);
2356                                         if (purple_email_is_valid(tmpurlbuf)) {
2357                                                 g_string_append_printf(ret, "<A HREF=\"mailto:%s\">%s</A>",
2358                                                                 tmpurlbuf, url_buf);
2359                                         } else {
2360                                                 g_string_append(ret, url_buf);
2361                                         }
2362                                         g_free(url_buf);
2363                                         g_free(tmpurlbuf);
2364                                         c = t;
2365
2366                                         break;
2367                                 } else {
2368                                         g_string_append_unichar(gurl_buf, g);
2369                                         t = g_utf8_find_next_char(t, NULL);
2370                                 }
2371                         }
2372                 }
2373
2374                 if(*c == ')' && !inside_html) {
2375                         inside_paren--;
2376                         ret = g_string_append_c(ret, *c);
2377                         c++;
2378                 }
2379
2380                 if (*c == 0)
2381                         break;
2382
2383                 ret = g_string_append_c(ret, *c);
2384                 c++;
2385
2386         }
2387         return g_string_free(ret, FALSE);
2388 }
2389
2390 char *purple_unescape_text(const char *in)
2391 {
2392     GString *ret;
2393     const char *c = in;
2394
2395     if (in == NULL)
2396         return NULL;
2397
2398     ret = g_string_new("");
2399     while (*c) {
2400         int len;
2401         const char *ent;
2402
2403         if ((ent = purple_markup_unescape_entity(c, &len)) != NULL) {
2404             g_string_append(ret, ent);
2405             c += len;
2406         } else {
2407             g_string_append_c(ret, *c);
2408             c++;
2409         }
2410     }
2411
2412     return g_string_free(ret, FALSE);
2413 }
2414
2415 char *purple_unescape_html(const char *html)
2416 {
2417         GString *ret;
2418         const char *c = html;
2419
2420         if (html == NULL)
2421                 return NULL;
2422
2423         ret = g_string_new("");
2424         while (*c) {
2425                 int len;
2426                 const char *ent;
2427
2428                 if ((ent = purple_markup_unescape_entity(c, &len)) != NULL) {
2429                         g_string_append(ret, ent);
2430                         c += len;
2431                 } else if (!strncmp(c, "<br>", 4)) {
2432                         g_string_append_c(ret, '\n');
2433                         c += 4;
2434                 } else {
2435                         g_string_append_c(ret, *c);
2436                         c++;
2437                 }
2438         }
2439
2440         return g_string_free(ret, FALSE);
2441 }
2442
2443 char *
2444 purple_markup_slice(const char *str, guint x, guint y)
2445 {
2446         GString *ret;
2447         GQueue *q;
2448         guint z = 0;
2449         gboolean appended = FALSE;
2450         gunichar c;
2451         char *tag;
2452
2453         g_return_val_if_fail(str != NULL, NULL);
2454         g_return_val_if_fail(x <= y, NULL);
2455
2456         if (x == y)
2457                 return g_strdup("");
2458
2459         ret = g_string_new("");
2460         q = g_queue_new();
2461
2462         while (*str && (z < y)) {
2463                 c = g_utf8_get_char(str);
2464
2465                 if (c == '<') {
2466                         char *end = strchr(str, '>');
2467
2468                         if (!end) {
2469                                 g_string_free(ret, TRUE);
2470                                 while ((tag = g_queue_pop_head(q)))
2471                                         g_free(tag);
2472                                 g_queue_free(q);
2473                                 return NULL;
2474                         }
2475
2476                         if (!g_ascii_strncasecmp(str, "<img ", 5)) {
2477                                 z += strlen("[Image]");
2478                         } else if (!g_ascii_strncasecmp(str, "<br", 3)) {
2479                                 z += 1;
2480                         } else if (!g_ascii_strncasecmp(str, "<hr>", 4)) {
2481                                 z += strlen("\n---\n");
2482                         } else if (!g_ascii_strncasecmp(str, "</", 2)) {
2483                                 /* pop stack */
2484                                 char *tmp;
2485
2486                                 tmp = g_queue_pop_head(q);
2487                                 g_free(tmp);
2488                                 /* z += 0; */
2489                         } else {
2490                                 /* push it unto the stack */
2491                                 char *tmp;
2492
2493                                 tmp = g_strndup(str, end - str + 1);
2494                                 g_queue_push_head(q, tmp);
2495                                 /* z += 0; */
2496                         }
2497
2498                         if (z >= x) {
2499                                 g_string_append_len(ret, str, end - str + 1);
2500                         }
2501
2502                         str = end;
2503                 } else if (c == '&') {
2504                         char *end = strchr(str, ';');
2505                         if (!end) {
2506                                 g_string_free(ret, TRUE);
2507                                 while ((tag = g_queue_pop_head(q)))
2508                                         g_free(tag);
2509                                 g_queue_free(q);
2510
2511                                 return NULL;
2512                         }
2513
2514                         if (z >= x)
2515                                 g_string_append_len(ret, str, end - str + 1);
2516
2517                         z++;
2518                         str = end;
2519                 } else {
2520                         if (z == x && z > 0 && !appended) {
2521                                 GList *l = q->tail;
2522
2523                                 while (l) {
2524                                         tag = l->data;
2525                                         g_string_append(ret, tag);
2526                                         l = l->prev;
2527                                 }
2528                                 appended = TRUE;
2529                         }
2530
2531                         if (z >= x)
2532                                 g_string_append_unichar(ret, c);
2533                         z++;
2534                 }
2535
2536                 str = g_utf8_next_char(str);
2537         }
2538
2539         while ((tag = g_queue_pop_head(q))) {
2540                 char *name;
2541
2542                 name = purple_markup_get_tag_name(tag);
2543                 g_string_append_printf(ret, "</%s>", name);
2544                 g_free(name);
2545                 g_free(tag);
2546         }
2547
2548         g_queue_free(q);
2549         return g_string_free(ret, FALSE);
2550 }
2551
2552 char *
2553 purple_markup_get_tag_name(const char *tag)
2554 {
2555         int i;
2556         g_return_val_if_fail(tag != NULL, NULL);
2557         g_return_val_if_fail(*tag == '<', NULL);
2558
2559         for (i = 1; tag[i]; i++)
2560                 if (tag[i] == '>' || tag[i] == ' ' || tag[i] == '/')
2561                         break;
2562
2563         return g_strndup(tag+1, i-1);
2564 }
2565
2566 /**************************************************************************
2567  * Path/Filename Functions
2568  **************************************************************************/
2569 const char *
2570 purple_home_dir(void)
2571 {
2572 #ifndef _WIN32
2573         return g_get_home_dir();
2574 #else
2575         return wpurple_home_dir();
2576 #endif
2577 }
2578
2579 /* Returns the argument passed to -c IFF it was present, or ~/.purple. */
2580 const char *
2581 purple_user_dir(void)
2582 {
2583         if (custom_user_dir != NULL)
2584                 return custom_user_dir;
2585         else if (!user_dir)
2586                 user_dir = g_build_filename(purple_home_dir(), ".purple", NULL);
2587
2588         return user_dir;
2589 }
2590
2591 static const gchar *
2592 purple_xdg_dir(gchar **xdg_dir, const gchar *xdg_base_dir, const gchar *xdg_type)
2593 {
2594         if (!*xdg_dir) {
2595                 if (!custom_user_dir) {
2596                         *xdg_dir = g_build_filename(xdg_base_dir, "purple", NULL);
2597                 } else {
2598                         *xdg_dir = g_build_filename(custom_user_dir, xdg_type, NULL);
2599                 }
2600         }
2601
2602         return *xdg_dir;
2603 }
2604
2605 const gchar *
2606 purple_cache_dir(void)
2607 {
2608         return purple_xdg_dir(&cache_dir, g_get_user_cache_dir(), "cache");
2609 }
2610
2611 const gchar *
2612 purple_config_dir(void)
2613 {
2614         return purple_xdg_dir(&config_dir, g_get_user_config_dir(), "config");
2615 }
2616
2617 const gchar *
2618 purple_data_dir(void)
2619 {
2620         return purple_xdg_dir(&data_dir, g_get_user_data_dir(), "data");
2621 }
2622
2623 gboolean
2624 purple_move_to_xdg_base_dir(const char *purple_xdg_dir, char *path)
2625 {
2626         gint mkdir_res;
2627         gchar *xdg_path;
2628         gboolean xdg_path_exists;
2629
2630         /* Create destination directory */
2631         mkdir_res = purple_build_dir(purple_xdg_dir, S_IRWXU);
2632         if (mkdir_res == -1) {
2633                 purple_debug_error("util", "Error creating xdg directory %s: %s; failed migration\n",
2634                                         purple_xdg_dir, g_strerror(errno));
2635                 return FALSE;
2636         }
2637
2638         xdg_path = g_build_filename(purple_xdg_dir, path, NULL);
2639         xdg_path_exists = g_file_test(xdg_path, G_FILE_TEST_EXISTS);
2640         if (!xdg_path_exists) {
2641                 gchar *old_path;
2642                 gboolean old_path_exists;
2643
2644 G_GNUC_BEGIN_IGNORE_DEPRECATIONS
2645                 old_path = g_build_filename(purple_user_dir(), path, NULL);
2646 G_GNUC_END_IGNORE_DEPRECATIONS
2647                 old_path_exists = g_file_test(old_path, G_FILE_TEST_EXISTS);
2648                 if (old_path_exists) {
2649                         int rename_res;
2650
2651                         rename_res = g_rename(old_path, xdg_path);
2652                         if (rename_res == -1) {
2653                                 purple_debug_error("util", "Error renaming %s to %s; failed migration\n",
2654                                                         old_path, xdg_path);
2655                                 g_free(old_path);
2656                                 g_free(xdg_path);
2657
2658                                 return FALSE;
2659                         }
2660                 }
2661
2662                 g_free(old_path);
2663         }
2664
2665         g_free(xdg_path);
2666
2667         return TRUE;
2668 }
2669
2670 void purple_util_set_user_dir(const char *dir)
2671 {
2672         g_free(custom_user_dir);
2673
2674         if (dir != NULL && *dir)
2675                 custom_user_dir = g_strdup(dir);
2676         else
2677                 custom_user_dir = NULL;
2678 }
2679
2680 int purple_build_dir(const char *path, int mode)
2681 {
2682         return g_mkdir_with_parents(path, mode);
2683 }
2684
2685 static gboolean
2686 purple_util_write_data_to_file_common(const char *dir, const char *filename, const char *data, gssize size)
2687 {
2688         gchar *filename_full;
2689         gboolean ret = FALSE;
2690
2691         g_return_val_if_fail(dir != NULL, FALSE);
2692
2693         purple_debug_misc("util", "Writing file %s to directory %s",
2694                           filename, dir);
2695
2696         /* Ensure the directory exists */
2697         if (!g_file_test(dir, G_FILE_TEST_IS_DIR))
2698         {
2699                 if (g_mkdir(dir, S_IRUSR | S_IWUSR | S_IXUSR) == -1)
2700                 {
2701                         purple_debug_error("util", "Error creating directory %s: %s\n",
2702                                            dir, g_strerror(errno));
2703                         return FALSE;
2704                 }
2705         }
2706
2707         filename_full = g_build_filename(dir, filename, NULL);
2708
2709         ret = purple_util_write_data_to_file_absolute(filename_full, data, size);
2710
2711         g_free(filename_full);
2712         return ret;
2713 }
2714
2715 gboolean
2716 purple_util_write_data_to_file(const char *filename, const char *data, gssize size)
2717 {
2718 G_GNUC_BEGIN_IGNORE_DEPRECATIONS
2719         const char *user_dir = purple_user_dir();
2720 G_GNUC_END_IGNORE_DEPRECATIONS
2721         gboolean ret = purple_util_write_data_to_file_common(user_dir, filename, data, size);
2722
2723         return ret;
2724 }
2725
2726 gboolean
2727 purple_util_write_data_to_cache_file(const char *filename, const char *data, gssize size)
2728 {
2729         const char *cache_dir = purple_cache_dir();
2730         gboolean ret = purple_util_write_data_to_file_common(cache_dir, filename, data, size);
2731
2732         return ret;
2733 }
2734
2735 gboolean
2736 purple_util_write_data_to_config_file(const char *filename, const char *data, gssize size)
2737 {
2738         const char *config_dir = purple_config_dir();
2739         gboolean ret = purple_util_write_data_to_file_common(config_dir, filename, data, size);
2740
2741         return ret;
2742 }
2743
2744 gboolean
2745 purple_util_write_data_to_data_file(const char *filename, const char *data, gssize size)
2746 {
2747         const char *data_dir = purple_data_dir();
2748         gboolean ret = purple_util_write_data_to_file_common(data_dir, filename, data, size);
2749
2750         return ret;
2751 }
2752
2753 gboolean
2754 purple_util_write_data_to_file_absolute(const char *filename_full, const char *data, gssize size)
2755 {
2756         GFile *file;
2757         GError *err = NULL;
2758
2759         g_return_val_if_fail(size >= -1, FALSE);
2760
2761         if (size == -1) {
2762                 size = strlen(data);
2763         }
2764
2765         file = g_file_new_for_path(filename_full);
2766
2767         if (!g_file_replace_contents(file, data, size, NULL, FALSE,
2768                         G_FILE_CREATE_PRIVATE, NULL, NULL, &err)) {
2769                 purple_debug_error("util", "Error writing file: %s: %s\n",
2770                                    filename_full, err->message);
2771                 g_clear_error(&err);
2772                 g_object_unref(file);
2773                 return FALSE;
2774         }
2775
2776         g_object_unref(file);
2777         return TRUE;
2778 }
2779
2780 PurpleXmlNode *
2781 purple_util_read_xml_from_file(const char *filename, const char *description)
2782 {
2783 G_GNUC_BEGIN_IGNORE_DEPRECATIONS
2784         return purple_xmlnode_from_file(purple_user_dir(), filename, description, "util");
2785 G_GNUC_END_IGNORE_DEPRECATIONS
2786 }
2787
2788 PurpleXmlNode *
2789 purple_util_read_xml_from_cache_file(const char *filename, const char *description)
2790 {
2791         return purple_xmlnode_from_file(purple_cache_dir(), filename, description, "util");
2792 }
2793
2794 PurpleXmlNode *
2795 purple_util_read_xml_from_config_file(const char *filename, const char *description)
2796 {
2797         return purple_xmlnode_from_file(purple_config_dir(), filename, description, "util");
2798 }
2799
2800 PurpleXmlNode *
2801 purple_util_read_xml_from_data_file(const char *filename, const char *description)
2802 {
2803         return purple_xmlnode_from_file(purple_data_dir(), filename, description, "util");
2804 }
2805
2806 /*
2807  * Like mkstemp() but returns a file pointer, uses a pre-set template,
2808  * uses the semantics of tempnam() for the directory to use and allocates
2809  * the space for the filepath.
2810  *
2811  * Caller is responsible for closing the file and removing it when done,
2812  * as well as freeing the space pointed-to by "path" with g_free().
2813  *
2814  * Returns NULL on failure and cleans up after itself if so.
2815  */
2816 static const char *purple_mkstemp_templ = {"purpleXXXXXX"};
2817
2818 FILE *
2819 purple_mkstemp(char **fpath, gboolean binary)
2820 {
2821         const gchar *tmpdir;
2822         int fd;
2823         FILE *fp = NULL;
2824
2825         g_return_val_if_fail(fpath != NULL, NULL);
2826
2827         if((tmpdir = (gchar*)g_get_tmp_dir()) != NULL) {
2828                 if((*fpath = g_strdup_printf("%s" G_DIR_SEPARATOR_S "%s", tmpdir, purple_mkstemp_templ)) != NULL) {
2829                         fd = g_mkstemp(*fpath);
2830                         if(fd == -1) {
2831                                 purple_debug(PURPLE_DEBUG_ERROR, "purple_mkstemp",
2832                                                    "Couldn't make \"%s\", error: %d\n",
2833                                                    *fpath, errno);
2834                         } else {
2835                                 if((fp = fdopen(fd, "r+")) == NULL) {
2836                                         close(fd);
2837                                         purple_debug(PURPLE_DEBUG_ERROR, "purple_mkstemp",
2838                                                            "Couldn't fdopen(), error: %d\n", errno);
2839                                 }
2840                         }
2841
2842                         if(!fp) {
2843                                 g_free(*fpath);
2844                                 *fpath = NULL;
2845                         }
2846                 }
2847         } else {
2848                 purple_debug(PURPLE_DEBUG_ERROR, "purple_mkstemp",
2849                                    "g_get_tmp_dir() failed!\n");
2850         }
2851
2852         return fp;
2853 }
2854
2855 gboolean
2856 purple_program_is_valid(const char *program)
2857 {
2858         GError *error = NULL;
2859         char **argv;
2860         gchar *progname;
2861         gboolean is_valid = FALSE;
2862
2863         g_return_val_if_fail(program != NULL,  FALSE);
2864         g_return_val_if_fail(*program != '\0', FALSE);
2865
2866         if (!g_shell_parse_argv(program, NULL, &argv, &error)) {
2867                 purple_debug(PURPLE_DEBUG_ERROR, "program_is_valid",
2868                                    "Could not parse program '%s': %s\n",
2869                                    program, error->message);
2870                 g_error_free(error);
2871                 return FALSE;
2872         }
2873
2874         if (argv == NULL) {
2875                 return FALSE;
2876         }
2877
2878         progname = g_find_program_in_path(argv[0]);
2879         is_valid = (progname != NULL);
2880
2881         if(purple_debug_is_verbose())
2882                 purple_debug_info("program_is_valid", "Tested program %s.  %s.\n", program,
2883                                 is_valid ? "Valid" : "Invalid");
2884
2885         g_strfreev(argv);
2886         g_free(progname);
2887
2888         return is_valid;
2889 }
2890
2891
2892 gboolean
2893 purple_running_gnome(void)
2894 {
2895 #ifndef _WIN32
2896         gchar *tmp = g_find_program_in_path("gvfs-open");
2897
2898         if (tmp == NULL) {
2899                 tmp = g_find_program_in_path("gnome-open");
2900
2901                 if (tmp == NULL) {
2902                         return FALSE;
2903                 }
2904         }
2905
2906         g_free(tmp);
2907
2908         tmp = (gchar *)g_getenv("GNOME_DESKTOP_SESSION_ID");
2909
2910         return ((tmp != NULL) && (*tmp != '\0'));
2911 #else
2912         return FALSE;
2913 #endif
2914 }
2915
2916 gboolean
2917 purple_running_kde(void)
2918 {
2919 #ifndef _WIN32
2920         gchar *tmp = g_find_program_in_path("kfmclient");
2921         const char *session;
2922
2923         if (tmp == NULL)
2924                 return FALSE;
2925         g_free(tmp);
2926
2927         session = g_getenv("KDE_FULL_SESSION");
2928         if (purple_strequal(session, "true"))
2929                 return TRUE;
2930
2931         /* If you run Purple from Konsole under !KDE, this will provide a
2932          * a false positive.  Since we do the GNOME checks first, this is
2933          * only a problem if you're running something !(KDE || GNOME) and
2934          * you run Purple from Konsole. This really shouldn't be a problem. */
2935         return ((g_getenv("KDEDIR") != NULL) || g_getenv("KDEDIRS") != NULL);
2936 #else
2937         return FALSE;
2938 #endif
2939 }
2940
2941 gboolean
2942 purple_running_osx(void)
2943 {
2944 #if defined(__APPLE__)
2945         return TRUE;
2946 #else
2947         return FALSE;
2948 #endif
2949 }
2950
2951 typedef union purple_sockaddr {
2952         struct sockaddr         sa;
2953         struct sockaddr_in      sa_in;
2954 #if defined(AF_INET6)
2955         struct sockaddr_in6     sa_in6;
2956 #endif
2957         struct sockaddr_storage sa_stor;
2958 } PurpleSockaddr;
2959
2960 char *
2961 purple_fd_get_ip(int fd)
2962 {
2963         PurpleSockaddr addr;
2964         socklen_t namelen = sizeof(addr);
2965         int family;
2966
2967         g_return_val_if_fail(fd != 0, NULL);
2968
2969         if (getsockname(fd, &(addr.sa), &namelen))
2970                 return NULL;
2971
2972         family = addr.sa.sa_family;
2973
2974         if (family == AF_INET) {
2975                 return g_strdup(inet_ntoa(addr.sa_in.sin_addr));
2976         }
2977 #if defined(AF_INET6) && defined(HAVE_INET_NTOP)
2978         else if (family == AF_INET6) {
2979                 char host[INET6_ADDRSTRLEN];
2980                 const char *tmp;
2981
2982                 tmp = inet_ntop(family, &(addr.sa_in6.sin6_addr), host, sizeof(host));
2983                 return g_strdup(tmp);
2984         }
2985 #endif
2986
2987         return NULL;
2988 }
2989
2990 int
2991 purple_socket_get_family(int fd)
2992 {
2993         PurpleSockaddr addr;
2994         socklen_t len = sizeof(addr);
2995
2996         g_return_val_if_fail(fd >= 0, -1);
2997
2998         if (getsockname(fd, &(addr.sa), &len))
2999                 return -1;
3000
3001         return addr.sa.sa_family;
3002 }
3003
3004 gboolean
3005 purple_socket_speaks_ipv4(int fd)
3006 {
3007         int family;
3008
3009         g_return_val_if_fail(fd >= 0, FALSE);
3010
3011         family = purple_socket_get_family(fd);
3012
3013         switch (family) {
3014         case AF_INET:
3015                 return TRUE;
3016 #if defined(IPV6_V6ONLY)
3017         case AF_INET6:
3018         {
3019                 int val = 0;
3020                 socklen_t len = sizeof(val);
3021
3022                 if (getsockopt(fd, IPPROTO_IPV6, IPV6_V6ONLY, &val, &len) != 0)
3023                         return FALSE;
3024                 return !val;
3025         }
3026 #endif
3027         default:
3028                 return FALSE;
3029         }
3030 }
3031
3032 /**************************************************************************
3033  * String Functions
3034  **************************************************************************/
3035 const char *
3036 purple_normalize(PurpleAccount *account, const char *str)
3037 {
3038         const char *ret = NULL;
3039         static char buf[BUF_LEN];
3040
3041         /* This should prevent a crash if purple_normalize gets called with NULL str, see #10115 */
3042         g_return_val_if_fail(str != NULL, "");
3043
3044         if (account != NULL)
3045         {
3046                 PurpleProtocol *protocol =
3047                                 purple_protocols_find(purple_account_get_protocol_id(account));
3048
3049                 if (protocol != NULL)
3050                         ret = purple_protocol_client_iface_normalize(protocol, account, str);
3051         }
3052
3053         if (ret == NULL)
3054         {
3055                 char *tmp;
3056
3057                 tmp = g_utf8_normalize(str, -1, G_NORMALIZE_DEFAULT);
3058                 g_snprintf(buf, sizeof(buf), "%s", tmp);
3059                 g_free(tmp);
3060
3061                 ret = buf;
3062         }
3063
3064         return ret;
3065 }
3066
3067 /*
3068  * You probably don't want to call this directly, it is
3069  * mainly for use as a protocol callback function.  See the
3070  * comments in util.h.
3071  */
3072 const char *
3073 purple_normalize_nocase(const PurpleAccount *account, const char *str)
3074 {
3075         static char buf[BUF_LEN];
3076         char *tmp1, *tmp2;
3077
3078         g_return_val_if_fail(str != NULL, NULL);
3079
3080         tmp1 = g_utf8_strdown(str, -1);
3081         tmp2 = g_utf8_normalize(tmp1, -1, G_NORMALIZE_DEFAULT);
3082         g_snprintf(buf, sizeof(buf), "%s", tmp2 ? tmp2 : "");
3083         g_free(tmp2);
3084         g_free(tmp1);
3085
3086         return buf;
3087 }
3088
3089 gboolean
3090 purple_validate(const PurpleProtocol *protocol, const char *str)
3091 {
3092         const char *normalized;
3093
3094         g_return_val_if_fail(protocol != NULL, FALSE);
3095         g_return_val_if_fail(str != NULL, FALSE);
3096
3097         if (str[0] == '\0')
3098                 return FALSE;
3099
3100         if (!PURPLE_PROTOCOL_IMPLEMENTS(protocol, CLIENT, normalize))
3101                 return TRUE;
3102
3103         normalized = purple_protocol_client_iface_normalize(PURPLE_PROTOCOL(protocol),
3104                         NULL, str);
3105
3106         return (NULL != normalized);
3107 }
3108
3109 gchar *
3110 purple_strdup_withhtml(const gchar *src)
3111 {
3112         gulong destsize, i, j;
3113         gchar *dest;
3114
3115         g_return_val_if_fail(src != NULL, NULL);
3116
3117         /* New length is (length of src) + (number of \n's * 3) - (number of \r's) + 1 */
3118         destsize = 1;
3119         for (i = 0; src[i] != '\0'; i++)
3120         {
3121                 if (src[i] == '\n')
3122                         destsize += 4;
3123                 else if (src[i] != '\r')
3124                         destsize++;
3125         }
3126
3127         dest = g_malloc(destsize);
3128
3129         /* Copy stuff, ignoring \r's, because they are dumb */
3130         for (i = 0, j = 0; src[i] != '\0'; i++) {
3131                 if (src[i] == '\n') {
3132                         strcpy(&dest[j], "<BR>");
3133                         j += 4;
3134                 } else if (src[i] != '\r')
3135                         dest[j++] = src[i];
3136         }
3137
3138         dest[destsize-1] = '\0';
3139
3140         return dest;
3141 }
3142
3143 gboolean
3144 purple_str_has_prefix(const char *s, const char *p)
3145 {
3146         return g_str_has_prefix(s, p);
3147 }
3148
3149 gboolean
3150 purple_str_has_caseprefix(const gchar *s, const gchar *p)
3151 {
3152         g_return_val_if_fail(s, FALSE);
3153         g_return_val_if_fail(p, FALSE);
3154
3155         return (g_ascii_strncasecmp(s, p, strlen(p)) == 0);
3156 }
3157
3158 gboolean
3159 purple_str_has_suffix(const char *s, const char *x)
3160 {
3161         return g_str_has_suffix(s, x);
3162 }
3163
3164 char *
3165 purple_str_add_cr(const char *text)
3166 {
3167         char *ret = NULL;
3168         int count = 0, j;
3169         guint i;
3170
3171         g_return_val_if_fail(text != NULL, NULL);
3172
3173         if (text[0] == '\n')
3174                 count++;
3175         for (i = 1; i < strlen(text); i++)
3176                 if (text[i] == '\n' && text[i - 1] != '\r')
3177                         count++;
3178
3179         if (count == 0)
3180                 return g_strdup(text);
3181
3182         ret = g_malloc0(strlen(text) + count + 1);
3183
3184         i = 0; j = 0;
3185         if (text[i] == '\n')
3186                 ret[j++] = '\r';
3187         ret[j++] = text[i++];
3188         for (; i < strlen(text); i++) {
3189                 if (text[i] == '\n' && text[i - 1] != '\r')
3190                         ret[j++] = '\r';
3191                 ret[j++] = text[i];
3192         }
3193
3194         return ret;
3195 }
3196
3197 void
3198 purple_str_strip_char(char *text, char thechar)
3199 {
3200         int i, j;
3201
3202         g_return_if_fail(text != NULL);
3203
3204         for (i = 0, j = 0; text[i]; i++)
3205                 if (text[i] != thechar)
3206                         text[j++] = text[i];
3207
3208         text[j] = '\0';
3209 }
3210
3211 void
3212 purple_util_chrreplace(char *string, char delimiter,
3213                                          char replacement)
3214 {
3215         int i = 0;
3216
3217         g_return_if_fail(string != NULL);
3218
3219         while (string[i] != '\0')
3220         {
3221                 if (string[i] == delimiter)
3222                         string[i] = replacement;
3223                 i++;
3224         }
3225 }
3226
3227 gchar *
3228 purple_strreplace(const char *string, const char *delimiter,
3229                                 const char *replacement)
3230 {
3231         gchar **split;
3232         gchar *ret;
3233
3234         g_return_val_if_fail(string      != NULL, NULL);
3235         g_return_val_if_fail(delimiter   != NULL, NULL);
3236         g_return_val_if_fail(replacement != NULL, NULL);
3237
3238         split = g_strsplit(string, delimiter, 0);
3239         ret = g_strjoinv(replacement, split);
3240         g_strfreev(split);
3241
3242         return ret;
3243 }
3244
3245 gchar *
3246 purple_strcasereplace(const char *string, const char *delimiter,
3247                                         const char *replacement)
3248 {
3249         gchar *ret;
3250         int length_del, length_rep, i, j;
3251
3252         g_return_val_if_fail(string      != NULL, NULL);
3253         g_return_val_if_fail(delimiter   != NULL, NULL);
3254         g_return_val_if_fail(replacement != NULL, NULL);
3255
3256         length_del = strlen(delimiter);
3257         length_rep = strlen(replacement);
3258
3259         /* Count how many times the delimiter appears */
3260         i = 0; /* position in the source string */
3261         j = 0; /* number of occurrences of "delimiter" */
3262         while (string[i] != '\0') {
3263                 if (!g_ascii_strncasecmp(&string[i], delimiter, length_del)) {
3264                         i += length_del;
3265                         j += length_rep;
3266                 } else {
3267                         i++;
3268                         j++;
3269                 }
3270         }
3271
3272         ret = g_malloc(j+1);
3273
3274         i = 0; /* position in the source string */
3275         j = 0; /* position in the destination string */
3276         while (string[i] != '\0') {
3277                 if (!g_ascii_strncasecmp(&string[i], delimiter, length_del)) {
3278                         strncpy(&ret[j], replacement, length_rep);
3279                         i += length_del;
3280                         j += length_rep;
3281                 } else {
3282                         ret[j] = string[i];
3283                         i++;
3284                         j++;
3285                 }
3286         }
3287
3288         ret[j] = '\0';
3289
3290         return ret;
3291 }
3292
3293 /** TODO: Expose this when we can add API */
3294 static const char *
3295 purple_strcasestr_len(const char *haystack, gssize hlen, const char *needle, gssize nlen)
3296 {
3297         const char *tmp, *ret;
3298
3299         g_return_val_if_fail(haystack != NULL, NULL);
3300         g_return_val_if_fail(needle != NULL, NULL);
3301
3302         if (hlen == -1)
3303                 hlen = strlen(haystack);
3304         if (nlen == -1)
3305                 nlen = strlen(needle);
3306         tmp = haystack,
3307         ret = NULL;
3308
3309         g_return_val_if_fail(hlen > 0, NULL);
3310         g_return_val_if_fail(nlen > 0, NULL);
3311
3312         while (*tmp && !ret && (hlen - (tmp - haystack)) >= nlen) {
3313                 if (!g_ascii_strncasecmp(needle, tmp, nlen))
3314                         ret = tmp;
3315                 else
3316                         tmp++;
3317         }
3318
3319         return ret;
3320 }
3321
3322 const char *
3323 purple_strcasestr(const char *haystack, const char *needle)
3324 {
3325         return purple_strcasestr_len(haystack, -1, needle, -1);
3326 }
3327
3328 char *
3329 purple_str_seconds_to_string(guint secs)
3330 {
3331         char *ret = NULL;
3332         guint days, hrs, mins;
3333
3334         if (secs < 60)
3335         {
3336                 return g_strdup_printf(dngettext(PACKAGE, "%d second", "%d seconds", secs), secs);
3337         }
3338
3339         days = secs / (60 * 60 * 24);
3340         secs = secs % (60 * 60 * 24);
3341         hrs  = secs / (60 * 60);
3342         secs = secs % (60 * 60);
3343         mins = secs / 60;
3344         /* secs = secs % 60; */
3345
3346         if (days > 0)
3347         {
3348                 ret = g_strdup_printf(dngettext(PACKAGE, "%d day", "%d days", days), days);
3349         }
3350
3351         if (hrs > 0)
3352         {
3353                 if (ret != NULL)
3354                 {
3355                         char *tmp = g_strdup_printf(
3356                                         dngettext(PACKAGE, "%s, %d hour", "%s, %d hours", hrs),
3357                                                         ret, hrs);
3358                         g_free(ret);
3359                         ret = tmp;
3360                 }
3361                 else
3362                         ret = g_strdup_printf(dngettext(PACKAGE, "%d hour", "%d hours", hrs), hrs);
3363         }
3364
3365         if (mins > 0)
3366         {
3367                 if (ret != NULL)
3368                 {
3369                         char *tmp = g_strdup_printf(
3370                                         dngettext(PACKAGE, "%s, %d minute", "%s, %d minutes", mins),
3371                                                         ret, mins);
3372                         g_free(ret);
3373                         ret = tmp;
3374                 }
3375                 else
3376                         ret = g_strdup_printf(dngettext(PACKAGE, "%d minute", "%d minutes", mins), mins);
3377         }
3378
3379         return ret;
3380 }
3381
3382
3383 char *
3384 purple_str_binary_to_ascii(const unsigned char *binary, guint len)
3385 {
3386         GString *ret;
3387         guint i;
3388
3389         g_return_val_if_fail(len > 0, NULL);
3390
3391         ret = g_string_sized_new(len);
3392
3393         for (i = 0; i < len; i++)
3394                 if (binary[i] < 32 || binary[i] > 126)
3395                         g_string_append_printf(ret, "\\x%02x", binary[i] & 0xFF);
3396                 else if (binary[i] == '\\')
3397                         g_string_append(ret, "\\\\");
3398                 else
3399                         g_string_append_c(ret, binary[i]);
3400
3401         return g_string_free(ret, FALSE);
3402 }
3403
3404 size_t
3405 purple_utf16_size(const gunichar2 *str)
3406 {
3407         /* UTF16 cannot contain two consequent NUL bytes starting at even
3408          * position - see Unicode standards Chapter 3.9 D91 or RFC2781
3409          * Chapter 2.
3410          */
3411
3412         size_t i = 0;
3413
3414         g_return_val_if_fail(str != NULL, 0);
3415
3416         while (str[i++]);
3417
3418         return i * sizeof(gunichar2);
3419 }
3420
3421 void
3422 purple_str_wipe(gchar *str)
3423 {
3424         if (str == NULL)
3425                 return;
3426         memset(str, 0, strlen(str));
3427         g_free(str);
3428 }
3429
3430 void
3431 purple_utf16_wipe(gunichar2 *str)
3432 {
3433         if (str == NULL)
3434                 return;
3435         memset(str, 0, purple_utf16_size(str));
3436         g_free(str);
3437 }
3438
3439 /**************************************************************************
3440  * URI/URL Functions
3441  **************************************************************************/
3442
3443 void purple_got_protocol_handler_uri(const char *uri)
3444 {
3445         char proto[11];
3446         char delimiter;
3447         const char *tmp, *param_string;
3448         char *cmd;
3449         GHashTable *params = NULL;
3450         gsize len;
3451         if (!(tmp = strchr(uri, ':')) || tmp == uri) {
3452                 purple_debug_error("util", "Malformed protocol handler message - missing protocol.\n");
3453                 return;
3454         }
3455
3456         len = MIN(sizeof(proto) - 1, (gsize)(tmp - uri));
3457
3458         strncpy(proto, uri, len);
3459         proto[len] = '\0';
3460
3461         tmp++;
3462
3463         if (purple_strequal(proto, "xmpp"))
3464                 delimiter = ';';
3465         else
3466                 delimiter = '&';
3467
3468         purple_debug_info("util", "Processing message '%s' for protocol '%s' using delimiter '%c'.\n", tmp, proto, delimiter);
3469
3470         if ((param_string = strchr(tmp, '?'))) {
3471                 const char *keyend = NULL, *pairstart;
3472                 char *key, *value = NULL;
3473
3474                 cmd = g_strndup(tmp, (param_string - tmp));
3475                 param_string++;
3476
3477                 params = g_hash_table_new_full(g_str_hash, g_str_equal, g_free, g_free);
3478                 pairstart = tmp = param_string;
3479
3480                 while (*tmp || *pairstart) {
3481                         if (*tmp == delimiter || !(*tmp)) {
3482                                 /* If there is no explicit value */
3483                                 if (keyend == NULL) {
3484                                         keyend = tmp;
3485                                 }
3486                                 /* without these brackets, clang won't
3487                                  * recognize tmp as a non-NULL
3488                                  */
3489
3490                                 if (keyend && keyend != pairstart) {
3491                                         char *p;
3492                                         key = g_strndup(pairstart, (keyend - pairstart));
3493                                         /* If there is an explicit value */
3494                                         if (keyend != tmp && keyend != (tmp - 1))
3495                                                 value = g_strndup(keyend + 1, (tmp - keyend - 1));
3496                                         for (p = key; *p; ++p)
3497                                                 *p = g_ascii_tolower(*p);
3498                                         g_hash_table_insert(params, key, value);
3499                                 }
3500                                 keyend = value = NULL;
3501                                 pairstart = (*tmp) ? tmp + 1 : tmp;
3502                         } else if (*tmp == '=')
3503                                 keyend = tmp;
3504
3505                         if (*tmp)
3506                                 tmp++;
3507                 }
3508         } else
3509                 cmd = g_strdup(tmp);
3510
3511         purple_signal_emit_return_1(purple_get_core(), "uri-handler", proto, cmd, params);
3512
3513         g_free(cmd);
3514         if (params)
3515                 g_hash_table_destroy(params);
3516 }
3517
3518 const char *
3519 purple_url_decode(const char *str)
3520 {
3521         static char buf[BUF_LEN];
3522         guint i, j = 0;
3523         char *bum;
3524         char hex[3];
3525
3526         g_return_val_if_fail(str != NULL, NULL);
3527
3528         /*
3529          * XXX - This check could be removed and buf could be made
3530          * dynamically allocated, but this is easier.
3531          */
3532         if (strlen(str) >= BUF_LEN)
3533                 return NULL;
3534
3535         for (i = 0; i < strlen(str); i++) {
3536
3537                 if (str[i] != '%')
3538                         buf[j++] = str[i];
3539                 else {
3540                         strncpy(hex, str + ++i, 2);
3541                         hex[2] = '\0';
3542
3543                         /* i is pointing to the start of the number */
3544                         i++;
3545
3546                         /*
3547                          * Now it's at the end and at the start of the for loop
3548                          * will be at the next character.
3549                          */
3550                         buf[j++] = strtol(hex, NULL, 16);
3551                 }
3552         }
3553
3554         buf[j] = '\0';
3555
3556         if (!g_utf8_validate(buf, -1, (const char **)&bum))
3557                 *bum = '\0';
3558
3559         return buf;
3560 }
3561
3562 const char *
3563 purple_url_encode(const char *str)
3564 {
3565         const char *iter;
3566         static char buf[BUF_LEN];
3567         char utf_char[6];
3568         guint i, j = 0;
3569
3570         g_return_val_if_fail(str != NULL, NULL);
3571         g_return_val_if_fail(g_utf8_validate(str, -1, NULL), NULL);
3572
3573         iter = str;
3574         for (; *iter && j < (BUF_LEN - 1) ; iter = g_utf8_next_char(iter)) {
3575                 gunichar c = g_utf8_get_char(iter);
3576                 /* If the character is an ASCII character and is alphanumeric
3577                  * no need to escape */
3578                 if (c < 128 && (isalnum(c) || c == '-' || c == '.' || c == '_' || c == '~')) {
3579                         buf[j++] = c;
3580                 } else {
3581                         int bytes = g_unichar_to_utf8(c, utf_char);
3582                         for (i = 0; (int)i < bytes; i++) {
3583                                 if (j > (BUF_LEN - 4))
3584                                         break;
3585                                 if (i >= sizeof(utf_char)) {
3586                                         g_warn_if_reached();
3587                                         break;
3588                                 }
3589                                 sprintf(buf + j, "%%%02X", utf_char[i] & 0xff);
3590                                 j += 3;
3591                         }
3592                 }
3593         }
3594
3595         buf[j] = '\0';
3596
3597         return buf;
3598 }
3599
3600 /* Originally lifted from
3601  * http://www.oreillynet.com/pub/a/network/excerpt/spcookbook_chap03/index3.html
3602  * ... and slightly modified to be a bit more rfc822 compliant
3603  * ... and modified a bit more to make domain checking rfc1035 compliant
3604  *     with the exception permitted in rfc1101 for domains to start with digit
3605  *     but not completely checking to avoid conflicts with IP addresses
3606  */
3607 gboolean
3608 purple_email_is_valid(const char *address)
3609 {
3610         const char *c, *domain;
3611         static char *rfc822_specials = "()<>@,;:\\\"[]";
3612
3613         g_return_val_if_fail(address != NULL, FALSE);
3614
3615         if (*address == '.') return FALSE;
3616
3617         /* first we validate the name portion (name@domain) (rfc822)*/
3618         for (c = address;  *c;  c++) {
3619                 if (*c == '\"' && (c == address || *(c - 1) == '.' || *(c - 1) == '\"')) {
3620                         while (*++c) {
3621                                 if (*c == '\\') {
3622                                         if (*c++ && *c < 127 && *c > 0 && *c != '\n' && *c != '\r') continue;
3623                                         else return FALSE;
3624                                 }
3625                                 if (*c == '\"') break;
3626                                 if (*c < ' ' || *c >= 127) return FALSE;
3627                         }
3628                         if (!*c++) return FALSE;
3629                         if (*c == '@') break;
3630                         if (*c != '.') return FALSE;
3631                         continue;
3632                 }
3633                 if (*c == '@') break;
3634                 if (*c <= ' ' || *c >= 127) return FALSE;
3635                 if (strchr(rfc822_specials, *c)) return FALSE;
3636         }
3637
3638         /* It's obviously not an email address if we didn't find an '@' above */
3639         if (*c == '\0') return FALSE;
3640
3641         /* strictly we should return false if (*(c - 1) == '.') too, but I think
3642          * we should permit user.@domain type addresses - they do work :) */
3643         if (c == address) return FALSE;
3644
3645         /* next we validate the domain portion (name@domain) (rfc1035 & rfc1011) */
3646         if (!*(domain = ++c)) return FALSE;
3647         do {
3648                 if (*c == '.' && (c == domain || *(c - 1) == '.' || *(c - 1) == '-'))
3649                         return FALSE;
3650                 if (*c == '-' && (*(c - 1) == '.' || *(c - 1) == '@')) return FALSE;
3651                 if ((*c < '0' && *c != '-' && *c != '.') || (*c > '9' && *c < 'A') ||
3652                         (*c > 'Z' && *c < 'a') || (*c > 'z')) return FALSE;
3653         } while (*++c);
3654
3655         if (*(c - 1) == '-') return FALSE;
3656
3657         return ((c - domain) > 3 ? TRUE : FALSE);
3658 }
3659
3660 gboolean
3661 purple_ipv4_address_is_valid(const char *ip)
3662 {
3663         int c, o1, o2, o3, o4;
3664         char end;
3665
3666         g_return_val_if_fail(ip != NULL, FALSE);
3667
3668         c = sscanf(ip, "%d.%d.%d.%d%c", &o1, &o2, &o3, &o4, &end);
3669         if (c != 4 || o1 < 0 || o1 > 255 || o2 < 0 || o2 > 255 || o3 < 0 || o3 > 255 || o4 < 0 || o4 > 255)
3670                 return FALSE;
3671         return TRUE;
3672 }
3673
3674 gboolean
3675 purple_ipv6_address_is_valid(const gchar *ip)
3676 {
3677         const gchar *c;
3678         gboolean double_colon = FALSE;
3679         gint chunks = 1;
3680         gint in = 0;
3681
3682         g_return_val_if_fail(ip != NULL, FALSE);
3683
3684         if (*ip == '\0')
3685                 return FALSE;
3686
3687         for (c = ip; *c; ++c) {
3688                 if ((*c >= '0' && *c <= '9') ||
3689                         (*c >= 'a' && *c <= 'f') ||
3690                         (*c >= 'A' && *c <= 'F')) {
3691                         if (++in > 4)
3692                                 /* Only four hex digits per chunk */
3693                                 return FALSE;
3694                         continue;
3695                 } else if (*c == ':') {
3696                         /* The start of a new chunk */
3697                         ++chunks;
3698                         in = 0;
3699                         if (*(c + 1) == ':') {
3700                                 /*
3701                                  * '::' indicates a consecutive series of chunks full
3702                                  * of zeroes. There can be only one of these per address.
3703                                  */
3704                                 if (double_colon)
3705                                         return FALSE;
3706                                 double_colon = TRUE;
3707                         }
3708                 } else
3709                         return FALSE;
3710         }
3711
3712         /*
3713          * Either we saw a '::' and there were fewer than 8 chunks -or-
3714          * we didn't see a '::' and saw exactly 8 chunks.
3715          */
3716         return (double_colon && chunks < 8) || (!double_colon && chunks == 8);
3717 }
3718
3719 gboolean
3720 purple_ip_address_is_valid(const char *ip)
3721 {
3722         return (purple_ipv4_address_is_valid(ip) || purple_ipv6_address_is_valid(ip));
3723 }
3724
3725 /* Stolen from gnome_uri_list_extract_uris */
3726 GList *
3727 purple_uri_list_extract_uris(const gchar *uri_list)
3728 {
3729         const gchar *p, *q;
3730         gchar *retval;
3731         GList *result = NULL;
3732
3733         g_return_val_if_fail (uri_list != NULL, NULL);
3734
3735         p = uri_list;
3736
3737         /* We don't actually try to validate the URI according to RFC
3738         * 2396, or even check for allowed characters - we just ignore
3739         * comments and trim whitespace off the ends.  We also
3740         * allow LF delimination as well as the specified CRLF.
3741         */
3742         while (p) {
3743                 if (*p != '#') {
3744                         while (isspace(*p))
3745                                 p++;
3746
3747                         q = p;
3748                         while (*q && (*q != '\n') && (*q != '\r'))
3749                                 q++;
3750
3751                         if (q > p) {
3752                                 q--;
3753                                 while (q > p && isspace(*q))
3754                                         q--;
3755
3756                                 retval = (gchar*)g_malloc (q - p + 2);
3757                                 strncpy (retval, p, q - p + 1);
3758                                 retval[q - p + 1] = '\0';
3759
3760                                 result = g_list_prepend (result, retval);
3761                         }
3762                 }
3763                 p = strchr (p, '\n');
3764                 if (p)
3765                         p++;
3766         }
3767
3768         return g_list_reverse (result);
3769 }
3770
3771
3772 /* Stolen from gnome_uri_list_extract_filenames */
3773 GList *
3774 purple_uri_list_extract_filenames(const gchar *uri_list)
3775 {
3776         GList *tmp_list, *node, *result;
3777
3778         g_return_val_if_fail (uri_list != NULL, NULL);
3779
3780         result = purple_uri_list_extract_uris(uri_list);
3781
3782         tmp_list = result;
3783         while (tmp_list) {
3784                 gchar *s = (gchar*)tmp_list->data;
3785
3786                 node = tmp_list;
3787                 tmp_list = tmp_list->next;
3788
3789                 if (!strncmp (s, "file:", 5)) {
3790                         node->data = g_filename_from_uri (s, NULL, NULL);
3791                         /* not sure if this fallback is useful at all */
3792                         if (!node->data) node->data = g_strdup (s+5);
3793                 } else {
3794                         result = g_list_delete_link(result, node);
3795                 }
3796                 g_free (s);
3797         }
3798         return result;
3799 }
3800
3801 char *
3802 purple_uri_escape_for_open(const char *unescaped)
3803 {
3804         /* Replace some special characters like $ with their percent-encoded value.
3805          * This shouldn't be necessary because we shell-escape the entire arg before
3806          * exec'ing the browser, however, we had a report that a URL containing
3807          * $(xterm) was causing xterm to start on his system. This is obviously a
3808          * bug on his system, but it's pretty easy for us to protect against it. */
3809         return g_uri_escape_string(unescaped, "[]:;/%#,+?=&@", FALSE);
3810 }
3811
3812 /**************************************************************************
3813  * UTF8 String Functions
3814  **************************************************************************/
3815 gchar *
3816 purple_utf8_try_convert(const char *str)
3817 {
3818         gsize converted;
3819         gchar *utf8;
3820
3821         g_return_val_if_fail(str != NULL, NULL);
3822
3823         if (g_utf8_validate(str, -1, NULL)) {
3824                 return g_strdup(str);
3825         }
3826
3827         utf8 = g_locale_to_utf8(str, -1, &converted, NULL, NULL);
3828         if (utf8 != NULL)
3829                 return utf8;
3830
3831         utf8 = g_convert(str, -1, "UTF-8", "ISO-8859-15", &converted, NULL, NULL);
3832         if ((utf8 != NULL) && (converted == strlen(str)))
3833                 return utf8;
3834
3835         g_free(utf8);
3836
3837         return NULL;
3838 }
3839
3840 #define utf8_first(x) ((x & 0x80) == 0 || (x & 0xe0) == 0xc0 \
3841                        || (x & 0xf0) == 0xe0 || (x & 0xf8) == 0xf0)
3842 gchar *
3843 purple_utf8_salvage(const char *str)
3844 {
3845         GString *workstr;
3846         const char *end;
3847
3848         g_return_val_if_fail(str != NULL, NULL);
3849
3850         workstr = g_string_sized_new(strlen(str));
3851
3852         do {
3853                 (void)g_utf8_validate(str, -1, &end);
3854                 workstr = g_string_append_len(workstr, str, end - str);
3855                 str = end;
3856                 if (*str == '\0')
3857                         break;
3858                 do {
3859                         workstr = g_string_append_c(workstr, '?');
3860                         str++;
3861                 } while (!utf8_first(*str));
3862         } while (*str != '\0');
3863
3864         return g_string_free(workstr, FALSE);
3865 }
3866
3867 gchar *
3868 purple_utf8_strip_unprintables(const gchar *str)
3869 {
3870         gchar *workstr, *iter;
3871         const gchar *bad;
3872
3873         if (str == NULL)
3874                 /* Act like g_strdup */
3875                 return NULL;
3876
3877         if (!g_utf8_validate(str, -1, &bad)) {
3878                 purple_debug_error("util", "purple_utf8_strip_unprintables(%s) failed; "
3879                                            "first bad character was %02x (%c)\n",
3880                                    str, *bad, *bad);
3881                 g_return_val_if_reached(NULL);
3882         }
3883
3884         workstr = iter = g_new(gchar, strlen(str) + 1);
3885         while (*str) {
3886                 gunichar ch = g_utf8_get_char(str);
3887                 gchar *next = g_utf8_next_char(str);
3888                 /*
3889                  * Char ::= #x9 | #xA | #xD | [#x20-#xD7FF] | [#xE000-#xFFFD] |
3890                  *          [#x10000-#x10FFFF]
3891                  */
3892                 if ((ch == '\t' || ch == '\n' || ch == '\r') ||
3893                                 (ch >= 0x20 && ch <= 0xD7FF) ||
3894                                 (ch >= 0xE000 && ch <= 0xFFFD) ||
3895                                 (ch >= 0x10000 && ch <= 0x10FFFF)) {
3896                         memcpy(iter, str, next - str);
3897                         iter += (next - str);
3898                 }
3899
3900                 str = next;
3901         }
3902
3903         /* nul-terminate the new string */
3904         *iter = '\0';
3905
3906         return workstr;
3907 }
3908
3909 /*
3910  * This function is copied from g_strerror() but changed to use
3911  * gai_strerror().
3912  */
3913 const gchar *
3914 purple_gai_strerror(gint errnum)
3915 {
3916         static GPrivate msg_private = G_PRIVATE_INIT(g_free);
3917         char *msg;
3918         int saved_errno = errno;
3919
3920         const char *msg_locale;
3921
3922         msg_locale = gai_strerror(errnum);
3923         if (g_get_charset(NULL))
3924         {
3925                 /* This string is already UTF-8--great! */
3926                 errno = saved_errno;
3927                 return msg_locale;
3928         }
3929         else
3930         {
3931                 gchar *msg_utf8 = g_locale_to_utf8(msg_locale, -1, NULL, NULL, NULL);
3932                 if (msg_utf8)
3933                 {
3934                         /* Stick in the quark table so that we can return a static result */
3935                         GQuark msg_quark = g_quark_from_string(msg_utf8);
3936                         g_free(msg_utf8);
3937
3938                         msg_utf8 = (gchar *)g_quark_to_string(msg_quark);
3939                         errno = saved_errno;
3940                         return msg_utf8;
3941                 }
3942         }
3943
3944         msg = g_private_get(&msg_private);
3945
3946         if (!msg)
3947         {
3948                 msg = g_new(gchar, 64);
3949                 g_private_set(&msg_private, msg);
3950         }
3951
3952         sprintf(msg, "unknown error (%d)", errnum);
3953
3954         errno = saved_errno;
3955         return msg;
3956 }
3957
3958 char *
3959 purple_utf8_ncr_encode(const char *str)
3960 {
3961         GString *out;
3962
3963         g_return_val_if_fail(str != NULL, NULL);
3964         g_return_val_if_fail(g_utf8_validate(str, -1, NULL), NULL);
3965
3966         out = g_string_new("");
3967
3968         for(; *str; str = g_utf8_next_char(str)) {
3969                 gunichar wc = g_utf8_get_char(str);
3970
3971                 /* super simple check. hopefully not too wrong. */
3972                 if(wc >= 0x80) {
3973                         g_string_append_printf(out, "&#%u;", (guint32) wc);
3974                 } else {
3975                         g_string_append_unichar(out, wc);
3976                 }
3977         }
3978
3979         return g_string_free(out, FALSE);
3980 }
3981
3982
3983 char *
3984 purple_utf8_ncr_decode(const char *str)
3985 {
3986         GString *out;
3987         char *buf, *b;
3988
3989         g_return_val_if_fail(str != NULL, NULL);
3990         g_return_val_if_fail(g_utf8_validate(str, -1, NULL), NULL);
3991
3992         buf = (char *) str;
3993         out = g_string_new("");
3994
3995         while( (b = strstr(buf, "&#")) ) {
3996                 gunichar wc;
3997                 int base = 0;
3998
3999                 /* append everything leading up to the &# */
4000                 g_string_append_len(out, buf, b-buf);
4001
4002                 b += 2; /* skip past the &# */
4003
4004                 /* strtoul will treat 0x prefix as hex, but not just x */
4005                 if(*b == 'x' || *b == 'X') {
4006                         base = 16;
4007                         b++;
4008                 }
4009
4010                 /* advances buf to the end of the ncr segment */
4011                 wc = (gunichar) strtoul(b, &buf, base);
4012
4013                 /* this mimics the previous impl of ncr_decode */
4014                 if(*buf == ';') {
4015                         g_string_append_unichar(out, wc);
4016                         buf++;
4017                 }
4018         }
4019
4020         /* append whatever's left */
4021         g_string_append(out, buf);
4022
4023         return g_string_free(out, FALSE);
4024 }
4025
4026
4027 int
4028 purple_utf8_strcasecmp(const char *a, const char *b)
4029 {
4030         char *a_norm = NULL;
4031         char *b_norm = NULL;
4032         int ret = -1;
4033
4034         if(!a && b)
4035                 return -1;
4036         else if(!b && a)
4037                 return 1;
4038         else if(!a && !b)
4039                 return 0;
4040
4041         if(!g_utf8_validate(a, -1, NULL) || !g_utf8_validate(b, -1, NULL))
4042         {
4043                 purple_debug_error("purple_utf8_strcasecmp",
4044                                                  "One or both parameters are invalid UTF8\n");
4045                 return ret;
4046         }
4047
4048         a_norm = g_utf8_casefold(a, -1);
4049         b_norm = g_utf8_casefold(b, -1);
4050         ret = g_utf8_collate(a_norm, b_norm);
4051         g_free(a_norm);
4052         g_free(b_norm);
4053
4054         return ret;
4055 }
4056
4057 /* previously conversation::find_nick() */
4058 gboolean
4059 purple_utf8_has_word(const char *haystack, const char *needle)
4060 {
4061         char *hay, *pin, *p;
4062         const char *start, *prev_char;
4063         gunichar before, after;
4064         int n;
4065         gboolean ret = FALSE;
4066
4067         start = hay = g_utf8_strdown(haystack, -1);
4068
4069         pin = g_utf8_strdown(needle, -1);
4070         n = strlen(pin);
4071
4072         while ((p = strstr(start, pin)) != NULL) {
4073                 prev_char = g_utf8_find_prev_char(hay, p);
4074                 before = -2;
4075                 if (prev_char) {
4076                         before = g_utf8_get_char(prev_char);
4077                 }
4078                 after = g_utf8_get_char_validated(p + n, - 1);
4079
4080                 if ((p == hay ||
4081                                 /* The character before is a reasonable guess for a word boundary
4082                                    ("!g_unichar_isalnum()" is not a valid way to determine word
4083                                     boundaries, but it is the only reasonable thing to do here),
4084                                    and isn't the '&' from a "&amp;" or some such entity*/
4085                                 (before != (gunichar)-2 && !g_unichar_isalnum(before) && *(p - 1) != '&'))
4086                                 && after != (gunichar)-2 && !g_unichar_isalnum(after)) {
4087                         ret = TRUE;
4088                         break;
4089                 }
4090                 start = p + 1;
4091         }
4092
4093         g_free(pin);
4094         g_free(hay);
4095
4096         return ret;
4097 }
4098
4099 gboolean purple_message_meify(char *message, gssize len)
4100 {
4101         char *c;
4102         gboolean inside_html = FALSE;
4103
4104         g_return_val_if_fail(message != NULL, FALSE);
4105
4106         if(len == -1)
4107                 len = strlen(message);
4108
4109         for (c = message; *c; c++, len--) {
4110                 if(inside_html) {
4111                         if(*c == '>')
4112                                 inside_html = FALSE;
4113                 } else {
4114                         if(*c == '<')
4115                                 inside_html = TRUE;
4116                         else
4117                                 break;
4118                 }
4119         }
4120
4121         if(*c && !g_ascii_strncasecmp(c, "/me ", 4)) {
4122                 memmove(c, c+4, len-3);
4123                 return TRUE;
4124         }
4125
4126         return FALSE;
4127 }
4128
4129 char *purple_text_strip_mnemonic(const char *in)
4130 {
4131         char *out;
4132         char *a;
4133         char *a0;
4134         const char *b;
4135
4136         g_return_val_if_fail(in != NULL, NULL);
4137
4138         out = g_malloc(strlen(in)+1);
4139         a = out;
4140         b = in;
4141
4142         a0 = a; /* The last non-space char seen so far, or the first char */
4143
4144         while(*b) {
4145                 if(*b == '_') {
4146                         if(a > out && b > in && *(b-1) == '(' && *(b+1) && !(*(b+1) & 0x80) && *(b+2) == ')') {
4147                                 /* Detected CJK style shortcut (Bug 875311) */
4148                                 a = a0; /* undo the left parenthesis */
4149                                 b += 3; /* and skip the whole mess */
4150                         } else if(*(b+1) == '_') {
4151                                 *(a++) = '_';
4152                                 b += 2;
4153                                 a0 = a;
4154                         } else {
4155                                 b++;
4156                         }
4157                 /* We don't want to corrupt the middle of UTF-8 characters */
4158                 } else if (!(*b & 0x80)) {      /* other 1-byte char */
4159                         if (*b != ' ')
4160                                 a0 = a;
4161                         *(a++) = *(b++);
4162                 } else {
4163                         /* Multibyte utf8 char, don't look for _ inside these */
4164                         int n = 0;
4165                         int i;
4166                         if ((*b & 0xe0) == 0xc0) {
4167                                 n = 2;
4168                         } else if ((*b & 0xf0) == 0xe0) {
4169                                 n = 3;
4170                         } else if ((*b & 0xf8) == 0xf0) {
4171                                 n = 4;
4172                         } else if ((*b & 0xfc) == 0xf8) {
4173                                 n = 5;
4174                         } else if ((*b & 0xfe) == 0xfc) {
4175                                 n = 6;
4176                         } else {                /* Illegal utf8 */
4177                                 n = 1;
4178                         }
4179                         a0 = a; /* unless we want to delete CJK spaces too */
4180                         for (i = 0; i < n && *b; i += 1) {
4181                                 *(a++) = *(b++);
4182                         }
4183                 }
4184         }
4185         *a = '\0';
4186
4187         return out;
4188 }
4189
4190 const char* purple_unescape_filename(const char *escaped) {
4191         return purple_url_decode(escaped);
4192 }
4193
4194
4195 /* this is almost identical to purple_url_encode (hence purple_url_decode
4196  * being used above), but we want to keep certain characters unescaped
4197  * for compat reasons */
4198 const char *
4199 purple_escape_filename(const char *str)
4200 {
4201         const char *iter;
4202         static char buf[BUF_LEN];
4203         char utf_char[6];
4204         guint i, j = 0;
4205
4206         g_return_val_if_fail(str != NULL, NULL);
4207         g_return_val_if_fail(g_utf8_validate(str, -1, NULL), NULL);
4208
4209         iter = str;
4210         for (; *iter && j < (BUF_LEN - 1) ; iter = g_utf8_next_char(iter)) {
4211                 gunichar c = g_utf8_get_char(iter);
4212                 /* If the character is an ASCII character and is alphanumeric,
4213                  * or one of the specified values, no need to escape */
4214                 if (c < 128 && (g_ascii_isalnum(c) || c == '@' || c == '-' ||
4215                                 c == '_' || c == '.' || c == '#')) {
4216                         buf[j++] = c;
4217                 } else {
4218                         int bytes = g_unichar_to_utf8(c, utf_char);
4219                         for (i = 0; (int)i < bytes; i++) {
4220                                 if (j > (BUF_LEN - 4))
4221                                         break;
4222                                 if (i >= sizeof(utf_char)) {
4223                                         g_warn_if_reached();
4224                                         break;
4225                                 }
4226                                 sprintf(buf + j, "%%%02x", utf_char[i] & 0xff);
4227                                 j += 3;
4228                         }
4229                 }
4230         }
4231 #ifdef _WIN32
4232         /* File/Directory names in windows cannot end in periods/spaces.
4233          * http://msdn.microsoft.com/en-us/library/aa365247%28VS.85%29.aspx
4234          */
4235         while (j > 0 && (buf[j - 1] == '.' || buf[j - 1] == ' '))
4236                 j--;
4237 #endif
4238         buf[j] = '\0';
4239
4240         return buf;
4241 }
4242
4243 gchar * purple_escape_js(const gchar *str)
4244 {
4245         gchar *escaped;
4246
4247         json_node_set_string(escape_js_node, str);
4248         json_generator_set_root(escape_js_gen, escape_js_node);
4249         escaped = json_generator_to_data(escape_js_gen, NULL);
4250         json_node_set_boolean(escape_js_node, FALSE);
4251
4252         return escaped;
4253 }
4254
4255 void purple_restore_default_signal_handlers(void)
4256 {
4257 #ifndef _WIN32
4258         signal(SIGHUP, SIG_DFL);        /* 1: terminal line hangup */
4259         signal(SIGINT, SIG_DFL);        /* 2: interrupt program */
4260         signal(SIGQUIT, SIG_DFL);       /* 3: quit program */
4261         signal(SIGILL,  SIG_DFL);       /* 4:  illegal instruction (not reset when caught) */
4262         signal(SIGTRAP, SIG_DFL);       /* 5:  trace trap (not reset when caught) */
4263         signal(SIGABRT, SIG_DFL);       /* 6:  abort program */
4264
4265 #ifdef SIGPOLL
4266         signal(SIGPOLL,  SIG_DFL);      /* 7:  pollable event (POSIX) */
4267 #endif /* SIGPOLL */
4268
4269 #ifdef SIGEMT
4270         signal(SIGEMT,  SIG_DFL);       /* 7:  EMT instruction (Non-POSIX) */
4271 #endif /* SIGEMT */
4272
4273         signal(SIGFPE,  SIG_DFL);       /* 8:  floating point exception */
4274         signal(SIGBUS,  SIG_DFL);       /* 10: bus error */
4275         signal(SIGSEGV, SIG_DFL);       /* 11: segmentation violation */
4276         signal(SIGSYS,  SIG_DFL);       /* 12: bad argument to system call */
4277         signal(SIGPIPE, SIG_DFL);       /* 13: write on a pipe with no reader */
4278         signal(SIGALRM, SIG_DFL);       /* 14: real-time timer expired */
4279         signal(SIGTERM, SIG_DFL);       /* 15: software termination signal */
4280         signal(SIGCHLD, SIG_DFL);       /* 20: child status has changed */
4281         signal(SIGXCPU, SIG_DFL);       /* 24: exceeded CPU time limit */
4282         signal(SIGXFSZ, SIG_DFL);       /* 25: exceeded file size limit */
4283 #endif /* !_WIN32 */
4284 }
4285
4286 static void
4287 set_status_with_attrs(PurpleStatus *status, ...)
4288 {
4289         va_list args;
4290         va_start(args, status);
4291         purple_status_set_active_with_attrs(status, TRUE, args);
4292         va_end(args);
4293 }
4294
4295 void purple_util_set_current_song(const char *title, const char *artist, const char *album)
4296 {
4297         GList *list = purple_accounts_get_all();
4298         for (; list; list = list->next) {
4299                 PurplePresence *presence;
4300                 PurpleStatus *tune;
4301                 PurpleAccount *account = list->data;
4302                 if (!purple_account_get_enabled(account, purple_core_get_ui()))
4303                         continue;
4304
4305                 presence = purple_account_get_presence(account);
4306                 tune = purple_presence_get_status(presence, "tune");
4307                 if (!tune)
4308                         continue;
4309                 if (title) {
4310                         set_status_with_attrs(tune,
4311                                         PURPLE_TUNE_TITLE, title,
4312                                         PURPLE_TUNE_ARTIST, artist,
4313                                         PURPLE_TUNE_ALBUM, album,
4314                                         NULL);
4315                 } else {
4316                         purple_status_set_active(tune, FALSE);
4317                 }
4318         }
4319 }
4320
4321 char * purple_util_format_song_info(const char *title, const char *artist, const char *album, gpointer unused)
4322 {
4323         GString *string;
4324         char *esc;
4325
4326         if (!title || !*title)
4327                 return NULL;
4328
4329         esc = g_markup_escape_text(title, -1);
4330         string = g_string_new("");
4331         g_string_append_printf(string, "%s", esc);
4332         g_free(esc);
4333
4334         if (artist && *artist) {
4335                 esc = g_markup_escape_text(artist, -1);
4336                 g_string_append_printf(string, _(" - %s"), esc);
4337                 g_free(esc);
4338         }
4339
4340         if (album && *album) {
4341                 esc = g_markup_escape_text(album, -1);
4342                 g_string_append_printf(string, _(" (%s)"), esc);
4343                 g_free(esc);
4344         }
4345
4346         return g_string_free(string, FALSE);
4347 }
4348
4349 const gchar *
4350 purple_get_host_name(void)
4351 {
4352         return g_get_host_name();
4353 }
4354
4355 gchar *
4356 purple_uuid_random(void)
4357 {
4358         guint32 tmp, a, b;
4359
4360         tmp = g_random_int();
4361         a = 0x4000 | (tmp & 0xFFF); /* 0x4000 to 0x4FFF */
4362         tmp >>= 12;
4363         b = ((1 << 3) << 12) | (tmp & 0x3FFF); /* 0x8000 to 0xBFFF */
4364
4365         tmp = g_random_int();
4366
4367         return g_strdup_printf("%08x-%04x-%04x-%04x-%04x%08x",
4368                         g_random_int(),
4369                         tmp & 0xFFFF,
4370                         a,
4371                         b,
4372                         (tmp >> 16) & 0xFFFF, g_random_int());
4373 }
4374
4375 void purple_callback_set_zero(gpointer data)
4376 {
4377         gpointer *ptr = data;
4378
4379         g_return_if_fail(ptr != NULL);
4380
4381         *ptr = NULL;
4382 }
4383
4384 GValue *
4385 purple_value_new(GType type)
4386 {
4387         GValue *ret;
4388
4389         g_return_val_if_fail(type != G_TYPE_NONE, NULL);
4390
4391         ret = g_new0(GValue, 1);
4392         g_value_init(ret, type);
4393
4394         return ret;
4395 }
4396
4397 GValue *
4398 purple_value_dup(GValue *value)
4399 {
4400         GValue *ret;
4401
4402         g_return_val_if_fail(value != NULL, NULL);
4403
4404         ret = g_new0(GValue, 1);
4405         g_value_init(ret, G_VALUE_TYPE(value));
4406         g_value_copy(value, ret);
4407
4408         return ret;
4409 }
4410
4411 void
4412 purple_value_free(GValue *value)
4413 {
4414         g_return_if_fail(value != NULL);
4415
4416         g_value_unset(value);
4417         g_free(value);
4418 }
4419
4420 gchar *purple_http_digest_calculate_session_key(
4421                 const gchar *algorithm,
4422                 const gchar *username,
4423                 const gchar *realm,
4424                 const gchar *password,
4425                 const gchar *nonce,
4426                 const gchar *client_nonce)
4427 {
4428         GChecksum *hasher;
4429         gchar *hash;
4430
4431         g_return_val_if_fail(username != NULL, NULL);
4432         g_return_val_if_fail(realm    != NULL, NULL);
4433         g_return_val_if_fail(password != NULL, NULL);
4434         g_return_val_if_fail(nonce    != NULL, NULL);
4435
4436         /* Check for a supported algorithm. */
4437         g_return_val_if_fail(algorithm == NULL ||
4438                                                  *algorithm == '\0' ||
4439                                                  g_ascii_strcasecmp(algorithm, "MD5") ||
4440                                                  g_ascii_strcasecmp(algorithm, "MD5-sess"), NULL);
4441
4442         hasher = g_checksum_new(G_CHECKSUM_MD5);
4443         g_return_val_if_fail(hasher != NULL, NULL);
4444
4445         g_checksum_update(hasher, (guchar *)username, -1);
4446         g_checksum_update(hasher, (guchar *)":", -1);
4447         g_checksum_update(hasher, (guchar *)realm, -1);
4448         g_checksum_update(hasher, (guchar *)":", -1);
4449         g_checksum_update(hasher, (guchar *)password, -1);
4450
4451         if (algorithm != NULL && !g_ascii_strcasecmp(algorithm, "MD5-sess"))
4452         {
4453                 guchar digest[16];
4454                 gsize digest_len = 16;
4455
4456                 if (client_nonce == NULL)
4457                 {
4458                         g_object_unref(hasher);
4459                         purple_debug_error("hash", "Required client_nonce missing for MD5-sess digest calculation.\n");
4460                         return NULL;
4461                 }
4462
4463                 g_checksum_get_digest(hasher, digest, &digest_len);
4464
4465                 g_checksum_reset(hasher);
4466                 g_checksum_update(hasher, digest, sizeof(digest));
4467                 g_checksum_update(hasher, (guchar *)":", -1);
4468                 g_checksum_update(hasher, (guchar *)nonce, -1);
4469                 g_checksum_update(hasher, (guchar *)":", -1);
4470                 g_checksum_update(hasher, (guchar *)client_nonce, -1);
4471         }
4472
4473         hash = g_strdup(g_checksum_get_string(hasher));
4474         g_checksum_free(hasher);
4475
4476         return hash;
4477 }
4478
4479 gchar *purple_http_digest_calculate_response(
4480                 const gchar *algorithm,
4481                 const gchar *method,
4482                 const gchar *digest_uri,
4483                 const gchar *qop,
4484                 const gchar *entity,
4485                 const gchar *nonce,
4486                 const gchar *nonce_count,
4487                 const gchar *client_nonce,
4488                 const gchar *session_key)
4489 {
4490         GChecksum *hash;
4491         gchar *hash2;
4492
4493         g_return_val_if_fail(method      != NULL, NULL);
4494         g_return_val_if_fail(digest_uri  != NULL, NULL);
4495         g_return_val_if_fail(nonce       != NULL, NULL);
4496         g_return_val_if_fail(session_key != NULL, NULL);
4497
4498         /* Check for a supported algorithm. */
4499         g_return_val_if_fail(algorithm == NULL ||
4500                                                  *algorithm == '\0' ||
4501                                                  g_ascii_strcasecmp(algorithm, "MD5") ||
4502                                                  g_ascii_strcasecmp(algorithm, "MD5-sess"), NULL);
4503
4504         /* Check for a supported "quality of protection". */
4505         g_return_val_if_fail(qop == NULL ||
4506                                                  *qop == '\0' ||
4507                                                  g_ascii_strcasecmp(qop, "auth") ||
4508                                                  g_ascii_strcasecmp(qop, "auth-int"), NULL);
4509
4510         hash = g_checksum_new(G_CHECKSUM_MD5);
4511         g_return_val_if_fail(hash != NULL, NULL);
4512
4513         g_checksum_update(hash, (guchar *)method, -1);
4514         g_checksum_update(hash, (guchar *)":", -1);
4515         g_checksum_update(hash, (guchar *)digest_uri, -1);
4516
4517         if (qop != NULL && !g_ascii_strcasecmp(qop, "auth-int"))
4518         {
4519                 gchar *entity_hash;
4520
4521                 if (entity == NULL)
4522                 {
4523                         g_checksum_free(hash);
4524                         purple_debug_error("hash", "Required entity missing for auth-int digest calculation.\n");
4525                         return NULL;
4526                 }
4527
4528                 entity_hash = g_compute_checksum_for_string(G_CHECKSUM_MD5,
4529                                 entity, -1);
4530
4531                 if (entity_hash == NULL) {
4532                         g_checksum_free(hash);
4533                         g_return_val_if_reached(NULL);
4534                 }
4535
4536                 g_checksum_update(hash, (guchar *)":", -1);
4537                 g_checksum_update(hash, (guchar *)entity_hash, -1);
4538                 g_free(entity_hash);
4539         }
4540
4541         hash2 = g_strdup(g_checksum_get_string(hash));
4542         g_checksum_reset(hash);
4543
4544         if (hash2 == NULL) {
4545                 g_checksum_free(hash);
4546                 g_return_val_if_reached(NULL);
4547         }
4548
4549         g_checksum_update(hash, (guchar *)session_key, -1);
4550         g_checksum_update(hash, (guchar *)":", -1);
4551         g_checksum_update(hash, (guchar *)nonce, -1);
4552         g_checksum_update(hash, (guchar *)":", -1);
4553
4554         if (qop != NULL && *qop != '\0')
4555         {
4556                 if (nonce_count == NULL)
4557                 {
4558                         g_checksum_free(hash);
4559                         purple_debug_error("hash", "Required nonce_count missing for digest calculation.\n");
4560                         return NULL;
4561                 }
4562
4563                 if (client_nonce == NULL)
4564                 {
4565                         g_checksum_free(hash);
4566                         purple_debug_error("hash", "Required client_nonce missing for digest calculation.\n");
4567                         return NULL;
4568                 }
4569
4570                 g_checksum_update(hash, (guchar *)nonce_count, -1);
4571                 g_checksum_update(hash, (guchar *)":", -1);
4572                 g_checksum_update(hash, (guchar *)client_nonce, -1);
4573                 g_checksum_update(hash, (guchar *)":", -1);
4574
4575                 g_checksum_update(hash, (guchar *)qop, -1);
4576
4577                 g_checksum_update(hash, (guchar *)":", -1);
4578         }
4579
4580         g_checksum_update(hash, (guchar *)hash2, -1);
4581         g_free(hash2);
4582
4583         hash2 = g_strdup(g_checksum_get_string(hash));
4584         g_checksum_free(hash);
4585
4586         return hash2;
4587 }
4588
4589 int
4590 _purple_fstat(int fd, GStatBuf *st)
4591 {
4592         int ret;
4593
4594         g_return_val_if_fail(st != NULL, -1);
4595
4596 #ifdef _WIN32
4597         ret = _fstat(fd, st);
4598 #else
4599         ret = fstat(fd, st);
4600 #endif
4601
4602         return ret;
4603 }