utfcpp/test_drivers/smoke_test/test.cpp


#include <cassert>
#include <vector>
#include <iterator>
#include "../../source/utf8.h"
using namespace utf8;
using namespace std;

int main()
{
    //append
    unsigned char u[5] = {0,0,0,0,0};

    unsigned char* end = append(0x0448, u);
    assert (u[0] == 0xd1 && u[1] == 0x88 && u[2] == 0 && u[3] == 0 && u[4] == 0);

    end = append(0x65e5, u);
    assert (u[0] == 0xe6 && u[1] == 0x97 && u[2] == 0xa5 && u[3] == 0 && u[4] == 0);

    end = append(0x10346, u);
    assert (u[0] == 0xf0 && u[1] == 0x90 && u[2] == 0x8d && u[3] == 0x86 && u[4] == 0);

    //next
    unsigned char twochars[] = {0xE6, 0x97, 0xA5, 0xd1, 0x88, 0x0};
    unsigned char* w = twochars;
    int cp = next(w, twochars + 6);
    assert (cp == 0x65e5);
    assert (w == twochars + 3);

    //previous
    cp = previous (w, twochars - 1);
    assert (cp == 0x65e5);
    assert (w == twochars);

    // advance
    w = twochars;
    advance (w, 2, twochars + 6);
    assert (w == twochars + 5);

    // distance
    size_t dist = utf8::distance(twochars, twochars + 5);
    assert (dist == 2);

    // utf32to8
    int utf32string[] = {0x448, 0x65E5, 0x10346, 0};
    vector<unsigned char> utf8result;
    utf32to8(utf32string, utf32string + 3, back_inserter(utf8result));
    assert (utf8result.size() == 9);

    //utf8to32
    vector<int> utf32result;
    utf8to32(twochars, twochars + 5, back_inserter(utf32result));
    assert (utf32result.size() == 2);

    //utf16to8
    unsigned short utf16string[] = {0x41, 0x0448, 0x65e5, 0xd834, 0xdd1e};
    utf8result.clear();
    utf16to8(utf16string, utf16string + 5, back_inserter(utf8result));
    assert (utf8result.size() == 10);

    //utf8to16
    unsigned char utf8_with_surrogates[] = {0xE6, 0x97, 0xA5, 0xd1, 0x88,
        0xf0, 0x9d, 0x84, 0x9e};
    vector <unsigned short> utf16result;
    utf8to16(utf8_with_surrogates, utf8_with_surrogates + 9, back_inserter(utf16result));
    assert (utf16result.size() == 4);
    assert (utf16result[2] == 0xd834);
    assert (utf16result[3] == 0xdd1e);

    //find_invalid
    unsigned char utf_invalid[] = {0xE6, 0x97, 0xA5, 0xd1, 0x88, 0xfa};
    unsigned char* invalid = find_invalid(utf_invalid, utf_invalid + 6);
    assert (invalid == utf_invalid + 5);

    //is_valid
    bool bvalid = is_valid(utf_invalid, utf_invalid + 6);
    assert (bvalid == false);
    bvalid = is_valid(utf8_with_surrogates, utf8_with_surrogates + 9);
    assert (bvalid == true);

    //is_bom
    unsigned char byte_order_mark[] = {0xef, 0xbb, 0xbf};
    bool bbom = is_bom(byte_order_mark);
    assert (bbom == true);

    //////////////////////////////////////////////////////////
    //// Unchecked variants
    //////////////////////////////////////////////////////////

    //append
    memset(u, 0, 5);
    end = unchecked::append(0x0448, u);
    assert (u[0] == 0xd1 && u[1] == 0x88 && u[2] == 0 && u[3] == 0 && u[4] == 0);

    end = unchecked::append(0x65e5, u);
    assert (u[0] == 0xe6 && u[1] == 0x97 && u[2] == 0xa5 && u[3] == 0 && u[4] == 0);

    end = unchecked::append(0x10346, u);
    assert (u[0] == 0xf0 && u[1] == 0x90 && u[2] == 0x8d && u[3] == 0x86 && u[4] == 0);

    //next
    w = twochars;
    cp = unchecked::next(w);
    assert (cp == 0x65e5);
    assert (w == twochars + 3);

    //previous
    cp = unchecked::previous (w);
    assert (cp == 0x65e5);
    assert (w == twochars);

    // advance
    w = twochars;
    unchecked::advance (w, 2);
    assert (w == twochars + 5);

    // distance
    dist = unchecked::distance(twochars, twochars + 5);
    assert (dist == 2);

    // utf32to8
    utf8result.clear();
    unchecked::utf32to8(utf32string, utf32string + 3, back_inserter(utf8result));
    assert (utf8result.size() == 9);

    //utf8to32
    utf32result.clear();
    unchecked::utf8to32(twochars, twochars + 5, back_inserter(utf32result));
    assert (utf32result.size() == 2);

    //utf16to8
    utf8result.clear();
    unchecked::utf16to8(utf16string, utf16string + 5, back_inserter(utf8result));
    assert (utf8result.size() == 10);

    //utf8to16
    utf16result.clear();
    unchecked::utf8to16(utf8_with_surrogates, utf8_with_surrogates + 9, back_inserter(utf16result));
    assert (utf16result.size() == 4);
    assert (utf16result[2] == 0xd834);
    assert (utf16result[3] == 0xdd1e);
}
Initial import of the project tree git-svn-id: http://svn.code.sf.net/p/utfcpp/code@1 a809a056-fc17-0410-9590-b4f493f8b08e 2006-07-07 11:48:37 +00:00
			`#include <cassert>`
			`#include <vector>`
			`#include <iterator>`
Fixed the relative path for utf8.h in test.cpp git-svn-id: http://svn.code.sf.net/p/utfcpp/code@9 a809a056-fc17-0410-9590-b4f493f8b08e 2006-07-18 11:35:09 +00:00			`#include "../../source/utf8.h"`
Initial import of the project tree git-svn-id: http://svn.code.sf.net/p/utfcpp/code@1 a809a056-fc17-0410-9590-b4f493f8b08e 2006-07-07 11:48:37 +00:00			`using namespace utf8;`
			`using namespace std;`

			`int main()`
			`{`
			`//append`
			`unsigned char u[5] = {0,0,0,0,0};`

			`unsigned char* end = append(0x0448, u);`
			`assert (u[0] == 0xd1 && u[1] == 0x88 && u[2] == 0 && u[3] == 0 && u[4] == 0);`

			`end = append(0x65e5, u);`
			`assert (u[0] == 0xe6 && u[1] == 0x97 && u[2] == 0xa5 && u[3] == 0 && u[4] == 0);`

			`end = append(0x10346, u);`
			`assert (u[0] == 0xf0 && u[1] == 0x90 && u[2] == 0x8d && u[3] == 0x86 && u[4] == 0);`

			`//next`
			`unsigned char twochars[] = {0xE6, 0x97, 0xA5, 0xd1, 0x88, 0x0};`
			`unsigned char* w = twochars;`
			`int cp = next(w, twochars + 6);`
			`assert (cp == 0x65e5);`
			`assert (w == twochars + 3);`

			`//previous`
			`cp = previous (w, twochars - 1);`
			`assert (cp == 0x65e5);`
			`assert (w == twochars);`

			`// advance`
			`w = twochars;`
			`advance (w, 2, twochars + 6);`
			`assert (w == twochars + 5);`

			`// distance`
			`size_t dist = utf8::distance(twochars, twochars + 5);`
			`assert (dist == 2);`

			`// utf32to8`
			`int utf32string[] = {0x448, 0x65E5, 0x10346, 0};`
			`vector<unsigned char> utf8result;`
			`utf32to8(utf32string, utf32string + 3, back_inserter(utf8result));`
			`assert (utf8result.size() == 9);`

			`//utf8to32`
			`vector<int> utf32result;`
			`utf8to32(twochars, twochars + 5, back_inserter(utf32result));`
			`assert (utf32result.size() == 2);`

			`//utf16to8`
			`unsigned short utf16string[] = {0x41, 0x0448, 0x65e5, 0xd834, 0xdd1e};`
			`utf8result.clear();`
			`utf16to8(utf16string, utf16string + 5, back_inserter(utf8result));`
			`assert (utf8result.size() == 10);`

			`//utf8to16`
			`unsigned char utf8_with_surrogates[] = {0xE6, 0x97, 0xA5, 0xd1, 0x88,`
			`0xf0, 0x9d, 0x84, 0x9e};`
			`vector <unsigned short> utf16result;`
			`utf8to16(utf8_with_surrogates, utf8_with_surrogates + 9, back_inserter(utf16result));`
			`assert (utf16result.size() == 4);`
			`assert (utf16result[2] == 0xd834);`
			`assert (utf16result[3] == 0xdd1e);`

			`//find_invalid`
			`unsigned char utf_invalid[] = {0xE6, 0x97, 0xA5, 0xd1, 0x88, 0xfa};`
			`unsigned char* invalid = find_invalid(utf_invalid, utf_invalid + 6);`
			`assert (invalid == utf_invalid + 5);`

			`//is_valid`
			`bool bvalid = is_valid(utf_invalid, utf_invalid + 6);`
			`assert (bvalid == false);`
			`bvalid = is_valid(utf8_with_surrogates, utf8_with_surrogates + 9);`
			`assert (bvalid == true);`

			`//is_bom`
			`unsigned char byte_order_mark[] = {0xef, 0xbb, 0xbf};`
			`bool bbom = is_bom(byte_order_mark);`
			`assert (bbom == true);`

			`//////////////////////////////////////////////////////////`
			`//// Unchecked variants`
			`//////////////////////////////////////////////////////////`

			`//append`
			`memset(u, 0, 5);`
			`end = unchecked::append(0x0448, u);`
			`assert (u[0] == 0xd1 && u[1] == 0x88 && u[2] == 0 && u[3] == 0 && u[4] == 0);`

			`end = unchecked::append(0x65e5, u);`
			`assert (u[0] == 0xe6 && u[1] == 0x97 && u[2] == 0xa5 && u[3] == 0 && u[4] == 0);`

			`end = unchecked::append(0x10346, u);`
			`assert (u[0] == 0xf0 && u[1] == 0x90 && u[2] == 0x8d && u[3] == 0x86 && u[4] == 0);`

			`//next`
			`w = twochars;`
			`cp = unchecked::next(w);`
			`assert (cp == 0x65e5);`
			`assert (w == twochars + 3);`

			`//previous`
			`cp = unchecked::previous (w);`
			`assert (cp == 0x65e5);`
			`assert (w == twochars);`

			`// advance`
			`w = twochars;`
			`unchecked::advance (w, 2);`
			`assert (w == twochars + 5);`

			`// distance`
			`dist = unchecked::distance(twochars, twochars + 5);`
			`assert (dist == 2);`

			`// utf32to8`
			`utf8result.clear();`
			`unchecked::utf32to8(utf32string, utf32string + 3, back_inserter(utf8result));`
			`assert (utf8result.size() == 9);`

			`//utf8to32`
			`utf32result.clear();`
			`unchecked::utf8to32(twochars, twochars + 5, back_inserter(utf32result));`
			`assert (utf32result.size() == 2);`

			`//utf16to8`
			`utf8result.clear();`
			`unchecked::utf16to8(utf16string, utf16string + 5, back_inserter(utf8result));`
			`assert (utf8result.size() == 10);`

			`//utf8to16`
			`utf16result.clear();`
			`unchecked::utf8to16(utf8_with_surrogates, utf8_with_surrogates + 9, back_inserter(utf16result));`
			`assert (utf16result.size() == 4);`
			`assert (utf16result[2] == 0xd834);`
			`assert (utf16result[3] == 0xdd1e);`
			`}`