00001
00002
00003
00004
00005
00006
00007
00008
00009
00010
00011
00012
00013
00014
00015
00016
00017
00018
00019
00020
00021
00022
00023
00024
00025
00026
00027
00028
00029
00030
00031
00032
00033
00034
00035
00036
00037
00038
00039
00040 module mango.convert.Unicode;
00041
00042 private import mango.convert.Utf;
00043 private import mango.convert.Type;
00044
00045
00046
00047
00048
00049
00050 struct Unicode
00051 {
00052
00053 enum {
00054 Unknown,
00055 UTF_8,
00056 UTF_8N,
00057 UTF_16,
00058 UTF_16BE,
00059 UTF_16LE,
00060 UTF_32,
00061 UTF_32BE,
00062 UTF_32LE,
00063 };
00064
00065 private uint _type = Type.Utf16;
00066
00067 private void[] tmp;
00068
00069 void dthis (int size = 0)
00070 {
00071 tmp = new ubyte[size];
00072 }
00073
00074 uint type ()
00075 {
00076 return _type;
00077 }
00078
00079 private void[] update (void[] t)
00080 {
00081 if (t.length > tmp.length)
00082 tmp = t;
00083 return t;
00084 }
00085
00086
00087
00088
00089
00090 static bool isValid (int encoding)
00091 {
00092 return (encoding >= Unknown && encoding <= UTF_32LE);
00093 }
00094
00095
00096
00097
00098
00099
00100 final void[] convert (void[] src, uint srcType, uint dstType)
00101 {
00102 enum : ubyte {char2char, char2wchar, char2dchar,
00103 wchar2char, wchar2wchar, wchar2dchar,
00104 dchar2char, dchar2wchar, dchar2dchar};
00105
00106 const int[][4] router = [
00107 [char2char, char2wchar, char2dchar, 0],
00108 [wchar2char, wchar2wchar, wchar2dchar, 0],
00109 [dchar2char, dchar2wchar, dchar2dchar, 0],
00110 [0, 0, 0, 0],
00111 ];
00112
00113
00114 srcType -= Type.Utf8;
00115 dstType -= Type.Utf8;
00116 assert (srcType < 3);
00117 assert (dstType < 3);
00118
00119 switch (srcType)
00120 {
00121 case char2char:
00122 return src;
00123
00124 case char2wchar:
00125 return Utf.toUtf16 (cast(char[]) src, cast(wchar[]) tmp);
00126
00127 case char2dchar:
00128 return Utf.toUtf32 (cast(char[]) src, cast(dchar[]) tmp);
00129
00130
00131 case wchar2char:
00132 return Utf.toUtf8 (cast(wchar[]) src, cast(char[]) tmp);
00133
00134 case wchar2wchar:
00135 return src;
00136
00137 case wchar2dchar:
00138 return Utf.toUtf32 (cast(wchar[]) src, cast(dchar[]) tmp);
00139
00140
00141 case dchar2char:
00142 return Utf.toUtf8 (cast(dchar[]) src, cast(char[]) tmp);
00143
00144 case dchar2wchar:
00145 return Utf.toUtf16 (cast(dchar[]) src, cast(wchar[]) tmp);
00146
00147 case dchar2dchar:
00148 return src;
00149
00150 default:
00151 return null;
00152 }
00153 }
00154 }