libpurple/protocols/gg/lib/encoding.c

branch
release-2.x.y
changeset 35617
c9069e0e3c36
parent 31826
0f6ab56fbf9d
child 35620
fb20cfee648a
child 35627
fd11790cc4d6
equal deleted inserted replaced
35602:ba59da68fb79 35617:c9069e0e3c36
15 * License along with this program; if not, write to the Free Software 15 * License along with this program; if not, write to the Free Software
16 * Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA 02111-1307, 16 * Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA 02111-1307,
17 * USA. 17 * USA.
18 */ 18 */
19 19
20 #include "strman.h"
20 #include <stdlib.h> 21 #include <stdlib.h>
21 #include <string.h>
22 #include <errno.h> 22 #include <errno.h>
23 23
24 #include "libgadu.h" 24 #include "libgadu.h"
25 #include "encoding.h" 25 #include "encoding.h"
26 26
33 /** 33 /**
34 * \internal Tablica konwersji CP1250 na Unikod. 34 * \internal Tablica konwersji CP1250 na Unikod.
35 */ 35 */
36 static const uint16_t table_cp1250[] = 36 static const uint16_t table_cp1250[] =
37 { 37 {
38 0x20ac, '?', 0x201a, '?', 0x201e, 0x2026, 0x2020, 0x2021, 38 0x20ac, '?', 0x201a, '?', 0x201e, 0x2026, 0x2020, 0x2021,
39 '?', 0x2030, 0x0160, 0x2039, 0x015a, 0x0164, 0x017d, 0x0179, 39 '?', 0x2030, 0x0160, 0x2039, 0x015a, 0x0164, 0x017d, 0x0179,
40 '?', 0x2018, 0x2019, 0x201c, 0x201d, 0x2022, 0x2013, 0x2014, 40 '?', 0x2018, 0x2019, 0x201c, 0x201d, 0x2022, 0x2013, 0x2014,
41 '?', 0x2122, 0x0161, 0x203a, 0x015b, 0x0165, 0x017e, 0x017a, 41 '?', 0x2122, 0x0161, 0x203a, 0x015b, 0x0165, 0x017e, 0x017a,
42 0x00a0, 0x02c7, 0x02d8, 0x0141, 0x00a4, 0x0104, 0x00a6, 0x00a7, 42 0x00a0, 0x02c7, 0x02d8, 0x0141, 0x00a4, 0x0104, 0x00a6, 0x00a7,
43 0x00a8, 0x00a9, 0x015e, 0x00ab, 0x00ac, 0x00ad, 0x00ae, 0x017b, 43 0x00a8, 0x00a9, 0x015e, 0x00ab, 0x00ac, 0x00ad, 0x00ae, 0x017b,
44 0x00b0, 0x00b1, 0x02db, 0x0142, 0x00b4, 0x00b5, 0x00b6, 0x00b7, 44 0x00b0, 0x00b1, 0x02db, 0x0142, 0x00b4, 0x00b5, 0x00b6, 0x00b7,
45 0x00b8, 0x0105, 0x015f, 0x00bb, 0x013d, 0x02dd, 0x013e, 0x017c, 45 0x00b8, 0x0105, 0x015f, 0x00bb, 0x013d, 0x02dd, 0x013e, 0x017c,
46 0x0154, 0x00c1, 0x00c2, 0x0102, 0x00c4, 0x0139, 0x0106, 0x00c7, 46 0x0154, 0x00c1, 0x00c2, 0x0102, 0x00c4, 0x0139, 0x0106, 0x00c7,
47 0x010c, 0x00c9, 0x0118, 0x00cb, 0x011a, 0x00cd, 0x00ce, 0x010e, 47 0x010c, 0x00c9, 0x0118, 0x00cb, 0x011a, 0x00cd, 0x00ce, 0x010e,
48 0x0110, 0x0143, 0x0147, 0x00d3, 0x00d4, 0x0150, 0x00d6, 0x00d7, 48 0x0110, 0x0143, 0x0147, 0x00d3, 0x00d4, 0x0150, 0x00d6, 0x00d7,
49 0x0158, 0x016e, 0x00da, 0x0170, 0x00dc, 0x00dd, 0x0162, 0x00df, 49 0x0158, 0x016e, 0x00da, 0x0170, 0x00dc, 0x00dd, 0x0162, 0x00df,
50 0x0155, 0x00e1, 0x00e2, 0x0103, 0x00e4, 0x013a, 0x0107, 0x00e7, 50 0x0155, 0x00e1, 0x00e2, 0x0103, 0x00e4, 0x013a, 0x0107, 0x00e7,
51 0x010d, 0x00e9, 0x0119, 0x00eb, 0x011b, 0x00ed, 0x00ee, 0x010f, 51 0x010d, 0x00e9, 0x0119, 0x00eb, 0x011b, 0x00ed, 0x00ee, 0x010f,
52 0x0111, 0x0144, 0x0148, 0x00f3, 0x00f4, 0x0151, 0x00f6, 0x00f7, 52 0x0111, 0x0144, 0x0148, 0x00f3, 0x00f4, 0x0151, 0x00f6, 0x00f7,
53 0x0159, 0x016f, 0x00fa, 0x0171, 0x00fc, 0x00fd, 0x0163, 0x02d9, 53 0x0159, 0x016f, 0x00fa, 0x0171, 0x00fc, 0x00fd, 0x0163, 0x02d9,
54 }; 54 };
55 55
56 /** 56 /**
57 * \internal Zamienia tekst kodowany CP1250 na UTF-8. 57 * \internal Zamienia tekst kodowany CP1250 na UTF-8.
58 * 58 *
98 uc = (unsigned char) src[i]; 98 uc = (unsigned char) src[i];
99 else 99 else
100 uc = table_cp1250[(unsigned char) src[i] - 128]; 100 uc = table_cp1250[(unsigned char) src[i] - 128];
101 101
102 if (uc < 0x80) 102 if (uc < 0x80)
103 result[j++] = uc; 103 result[j++] = (char) uc;
104 else if (uc < 0x800) { 104 else if (uc < 0x800) {
105 if (j + 1 > len) 105 if (j + 1 > len)
106 break; 106 break;
107 result[j++] = 0xc0 | ((uc >> 6) & 0x1f); 107 result[j++] = 0xc0 | ((uc >> 6) & 0x1f);
108 result[j++] = 0x80 | (uc & 0x3f); 108 result[j++] = 0x80 | (uc & 0x3f);
134 char *result; 134 char *result;
135 int i, j, len, uc_left = 0; 135 int i, j, len, uc_left = 0;
136 uint32_t uc = 0, uc_min = 0; 136 uint32_t uc = 0, uc_min = 0;
137 137
138 for (i = 0, len = 0; (src[i] != 0) && (i < src_length); i++) { 138 for (i = 0, len = 0; (src[i] != 0) && (i < src_length); i++) {
139 if ((src[i] & 0xc0) == 0xc0) { 139 if ((src[i] & 0xc0) != 0x80)
140 len++; 140 len++;
141 } else if ((src[i] & 0x80) == 0x00) {
142 len++;
143 }
144 } 141 }
145 142
146 if ((dst_length != -1) && (len > dst_length)) 143 if ((dst_length != -1) && (len > dst_length))
147 len = dst_length; 144 len = dst_length;
148 145
221 * \internal Zamienia kodowanie tekstu. 218 * \internal Zamienia kodowanie tekstu.
222 * 219 *
223 * \param src Tekst źródłowy. 220 * \param src Tekst źródłowy.
224 * \param src_encoding Kodowanie tekstu źródłowego. 221 * \param src_encoding Kodowanie tekstu źródłowego.
225 * \param dst_encoding Kodowanie tekstu docelowego. 222 * \param dst_encoding Kodowanie tekstu docelowego.
226 * \param src_length Długość ciągu źródłowego w bajtach (nigdy ujemna). 223 * \param src_length Długość ciągu źródłowego w bajtach (jeśli -1, zostanie obliczona na podstawie zawartości \p src).
227 * \param dst_length Długość ciągu docelowego w bajtach (jeśli -1, nieograniczona). 224 * \param dst_length Długość ciągu docelowego w bajtach (jeśli -1, nieograniczona).
228 * 225 *
229 * \return Zaalokowany bufor z tekstem w kodowaniu docelowym. 226 * \return Zaalokowany bufor z tekstem w kodowaniu docelowym.
230 */ 227 */
231 char *gg_encoding_convert(const char *src, gg_encoding_t src_encoding, gg_encoding_t dst_encoding, int src_length, int dst_length) 228 char *gg_encoding_convert(const char *src, gg_encoding_t src_encoding, gg_encoding_t dst_encoding, int src_length, int dst_length)
235 if (src == NULL) { 232 if (src == NULL) {
236 errno = EINVAL; 233 errno = EINVAL;
237 return NULL; 234 return NULL;
238 } 235 }
239 236
240 // specjalny przypadek obsługiwany ekspresowo 237 /* specjalny przypadek obsługiwany ekspresowo */
241 if ((dst_encoding == src_encoding) && (dst_length == -1) && (src_length == -1)) 238 if ((dst_encoding == src_encoding) && (dst_length == -1) && (src_length == -1))
242 return strdup(src); 239 return strdup(src);
243 240
244 if (src_length == -1) 241 if (src_length == -1)
245 src_length = strlen(src); 242 src_length = strlen(src);

mercurial