いちばん長いしりとり
Posted feedbacks - C++
これもまた全探索です。「ン」やその他リスト内でこれ以上続けられない単語をstopWordSetとして別扱いにしたり、少々の枝刈りもどきをやったり、OpenMPで並列処理したりしていますが焼け石に水ですね。110単語程度で数秒かかります。それ以上は面倒なので試していません。
ラムダ式を使ったりPStade.Ovenを使ったり節操ないことになっていますがご容赦を。VC++ 2010でコンパイルしています。
コピーを避けるため、しりとりの並びの表現においてconst std::wstring*で文字列を扱っていますが、それらが指す文字列はwordSetとstopWordSetの要素であり、ポインタの有効期限はその2つに変更があるまでです。このプログラムでは、その点問題ないようになっています。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223 224 225 226 227 228 229 230 231 232 233 234 235 236 237 238 239 240 241 242 243 244 245 246 247 248 249 250 251 252 253 254 255 256 257 258 259 260 261 262 263 264 265 266 267 268 269 270 271 272 273 274 275 276 277 278 279 280 281 282 283 284 285 286 287 288 289 290 291 292 293 294 295 296 297 298 299 300 301 302 303 304 305 306 307 308 309 310 311 312 313 314 315 316 317 318 319 320 321 322 323 324 325 326 327 328 329 330 | #define WINVER 0x0400
#define _WIN32_WINDOWS 0
#define _WIN32_WINNT 0
#define _WIN32_IE 0
#define _SECURE_SCL 0
#define _CRT_SECURE_NO_WARNINGS
#define _SCL_SECURE_NO_WARNINGS
#define _CRT_SECURE_CPP_OVERLOAD_STANDARD_NAMES 1
#define WIN32_LEAN_AND_MEAN
#pragma warning(disable: 4512 4819)
#include <iostream>
#include <fstream>
#include <locale>
#include <vector>
#include <deque>
#include <map>
#include <string>
#include <algorithm>
#include <numeric>
#include <iterator>
#include <functional>
#include <memory>
#include <utility>
#include <climits>
#include <omp.h>
#include <boost/timer.hpp>
#include <boost/range.hpp>
#include <boost/iterator_adaptors.hpp>
#include <boost/cast.hpp>
#include <pstade/oven/filtered.hpp>
#include <pstade/oven/algorithm.hpp>
#include <pstade/oven/numeric.hpp>
#include <pstade/oven/indirected.hpp>
#include <windows.h>
using boost::numeric_cast;
namespace ov = pstade::oven;
HANDLE hProcessHeap;
void* operator new(std::size_t size)
{
if (hProcessHeap == 0)
{
hProcessHeap = GetProcessHeap();
}
if (void* p = HeapAlloc(hProcessHeap, 0, size))
{
return p;
}
else
{
throw new std::bad_alloc();
}
}
void* operator new[](std::size_t size)
{
return operator new(size);
}
void operator delete(void* p)
{
HeapFree(hProcessHeap, 0, p);
}
void operator delete[](void* p)
{
operator delete(p);
}
struct WordInfo
{
std::wstring Word;
unsigned MaximumLength; //このWordから始めた場合に最も長く続た場合に得られる可能性のある長さ
explicit WordInfo(const std::wstring& word) : Word(word), MaximumLength(UINT_MAX) {}
explicit WordInfo(std::wstring&& word) : Word(std::move(word)), MaximumLength(UINT_MAX) {}
WordInfo(const WordInfo& wi) : Word(wi.Word), MaximumLength(wi.MaximumLength) {}
WordInfo(WordInfo&& wi) : Word(std::move(wi.Word)), MaximumLength(wi.MaximumLength) {}
WordInfo& operator =(const WordInfo& wi)
{
return *this = WordInfo(wi);
}
WordInfo& operator =(WordInfo&& wi)
{
Word = std::move(wi.Word);
MaximumLength = wi.MaximumLength;
wi.MaximumLength = 0;
return *this;
}
};
struct StringFirstComparer : std::binary_function<const WordInfo&, const WordInfo&, bool>
{
result_type operator ()(first_argument_type lhs, second_argument_type rhs) const
{
return (int)lhs.Word[0] < (int)rhs.Word[0];
}
};
typedef std::vector<WordInfo> wordset_t;
class WordResultList;
typedef std::shared_ptr<WordResultList> wordresult_t;
class WordResultList
{
public:
static wordresult_t Create(const std::wstring* word, wordresult_t next);
struct iterator : boost::iterator_adaptor<
iterator,
WordResultList*,
const std::wstring*,
boost::forward_traversal_tag>
{
iterator(WordResultList* p) : iterator_adaptor_(p) {}
void increment() { base_reference() = base()->next.get(); }
const std::wstring*& dereference() const { return base_reference()->word; }
};
iterator begin(){ return iterator(this); }
iterator end() { return iterator(NULL); }
unsigned size() {return listSize;}
private:
WordResultList(const std::wstring* word, wordresult_t nextWord)
: word(word), next(std::move(nextWord)), listSize(next.get() ? next->listSize + 1 : 1) {
}
private: //初めは定義していたが、使わないので削除した。
WordResultList(const WordResultList& y);
WordResultList(WordResultList&& y);
WordResultList& operator =(const WordResultList& y);
WordResultList& operator =(WordResultList&& y);
private:
wordresult_t next;
unsigned listSize;
const std::wstring* word;
};
wordresult_t WordResultList::Create(const std::wstring* word, wordresult_t next)
{
__declspec(thread) static HANDLE hHeap; // スレッドごとに異なるヒープを用意
if (hHeap == 0)
{
ULONG flags = 2;
hHeap = HeapCreate(0, 8192, 0); //HeapDestroyしていません。ごめんなさい。
HeapSetInformation(hHeap, HeapCompatibilityInformation, &flags, sizeof flags);
}
void* raw = HeapAlloc(hHeap, 0, sizeof WordResultList);
wordresult_t p(new(raw) WordResultList(word, std::move(next)), [](WordResultList* p) {p->~WordResultList();HeapFree(hHeap, 0, p);});
//wordresult_t p(new WordResultList(word, std::move(next)));
return p;
}
// 最も長いしりとりの列を返す。
// ただし、これまでの経過をresultList、次に使う言葉をnextWordとする。
wordresult_t GetLongestShifitoriListImpl(
wordresult_t const& resultList,
const std::wstring* nextWord,
const wordset_t& wordSet,
const wordset_t& stopWordSet)
{
using namespace std::placeholders;
wordresult_t result = WordResultList::Create(nextWord, resultList);
if (resultList && **resultList->begin() == L"セイキハ" && *nextWord == L"ハケヤマ")
{
Sleep(0);
}
WordInfo lastChar(std::wstring(1, nextWord->back()));
//nextWordの終わりの文字で始まる言葉を抽出。
auto r = ov::equal_range(wordSet, lastChar, StringFirstComparer())
| ov::filtered([&result](WordInfo const& e) -> bool {
auto it = std::find_if(result->begin(), result->end(), [&e](std::wstring const* p) -> bool {return *p == e.Word;});
return it == result->end(); // 使用済みの単語を除外
});
if (!boost::empty(r))
{
// 見つかれば再帰コースへ行く。
typedef std::pair<wordresult_t, unsigned> result_info_t;
return std::accumulate(boost::begin(r), boost::end(r), result_info_t(),
[&](result_info_t && lhs, WordInfo const& e) -> result_info_t
{
if (lhs.second >= e.MaximumLength)
{
return lhs; // e.Wordでしりとりを続けても絶対にlhs.firstより長くならない。
}
auto rhs = GetLongestShifitoriListImpl(result, &e.Word, wordSet, stopWordSet);
return (lhs.first ? lhs.first->size() : 0) > rhs->size()
? lhs
: result_info_t(std::move(rhs), rhs->size());
}).first;
}
else
{
// wordSetから追加できなかった場合、stopWordSetからの追加を試みて終了する。
auto it = ov::lower_bound(stopWordSet, lastChar, StringFirstComparer());
if (it != stopWordSet.end() && it->Word[0] == lastChar.Word[0])
{
return WordResultList::Create(&it->Word, result);
}
else
{
return result;
}
}
}
std::deque<const std::wstring*> GetLongestShifitoriList(wordset_t& wordSet, const wordset_t& stopWordSet)
{
std::deque<const std::wstring*> result;
if (wordSet.empty())
{
if (!stopWordSet.empty())
{
result.push_back(&stopWordSet.begin()->Word);
}
return result;
}
else
{
// スレッド別に最も長かった結果を保持
std::vector<std::deque<const std::wstring*>> allResult(omp_get_max_threads());
const int wordSetSize = numeric_cast<int>(wordSet.size());
#pragma omp parallel for schedule(static)
for (int i = 0; i < wordSetSize; ++i)
{
// 全単語について、その単語から始まるしりとりの列を生成してみる。
auto r = GetLongestShifitoriListImpl(wordresult_t(), &wordSet[i].Word, wordSet, stopWordSet);
std::deque<const std::wstring*> t;
std::copy(r->begin(), r->end(), std::front_inserter(t));
// wordSet[i].Wordから始めた場合に最も長い(= wordSetとstopWordSetの全単語を使えるとき)列の長さを記憶
wordSet[i].MaximumLength = numeric_cast<unsigned>(t.size()); //この代入、特にマルチスレッド対策していないけど許して。
std::deque<const std::wstring*>& cur = allResult[omp_get_thread_num()];
if (cur.empty() || cur.size() < t.size())
{
cur = std::move(t);
}
}
// allResultから最も長いものを選び出して、それを返す。
return *std::accumulate(allResult.begin(), allResult.end(), static_cast<const std::deque<const std::wstring*>*>(&result),
[](std::deque<const std::wstring*> const* lhs, std::deque<const std::wstring*> const& rhs) -> const std::deque<const std::wstring*>*
{
return lhs->size() > rhs.size() ? lhs : &rhs;
});
}
}
namespace
{
typedef std::pair<wchar_t, wchar_t> dakuon_t;
const dakuon_t dakuonReplaceList[] =
{
dakuon_t(L'ガ', L'カ'), dakuon_t(L'ギ', L'キ'), dakuon_t(L'グ', L'ク'), dakuon_t(L'ゲ', L'ケ'), dakuon_t(L'ゴ', L'コ'),
dakuon_t(L'ザ', L'サ'), dakuon_t(L'ジ', L'シ'), dakuon_t(L'ズ', L'ス'), dakuon_t(L'ゼ', L'セ'), dakuon_t(L'ゾ', L'ソ'),
dakuon_t(L'ダ', L'タ'), dakuon_t(L'ヂ', L'チ'), dakuon_t(L'ヅ', L'ツ'), dakuon_t(L'デ', L'テ'), dakuon_t(L'ド', L'ト'),
dakuon_t(L'バ', L'ハ'), dakuon_t(L'ビ', L'ヒ'), dakuon_t(L'ブ', L'フ'), dakuon_t(L'ベ', L'ヘ'), dakuon_t(L'ボ', L'ホ'),
dakuon_t(L'パ', L'ハ'), dakuon_t(L'ピ', L'ヒ'), dakuon_t(L'プ', L'フ'), dakuon_t(L'ペ', L'ヘ'), dakuon_t(L'ポ', L'ホ'),
dakuon_t(L'ァ', L'ア'), dakuon_t(L'ィ', L'イ'), dakuon_t(L'ゥ', L'ウ'), dakuon_t(L'ェ', L'エ'), dakuon_t(L'ォ', L'オ'),
dakuon_t(L'ャ', L'ヤ'), dakuon_t(L'ュ', L'ユ'), dakuon_t(L'ョ', L'ヨ'), dakuon_t(L'ッ', L'ツ'),
};
const std::map<wchar_t, wchar_t> dakuonRepalceMap(boost::begin(dakuonReplaceList), boost::end(dakuonReplaceList));
}
// 濁音・半濁音・拗音を清音に修正
void dakuonReplace(std::wstring& word)
{
std::for_each(word.begin(), word.end(), [](wchar_t& c)
{
auto it = dakuonRepalceMap.find(c);
if (it != dakuonRepalceMap.end())
{
c = it->second;
}
});
}
// wordSetのうち、後に続く言葉が全くないものを「ん」で終わる言葉と同様にstopWordSetへ移動させる。
void AdjustStopWord(wordset_t& wordSet, wordset_t& stopWordSet)
{
auto it = std::remove_if(wordSet.begin(), wordSet.end(),
[&wordSet, &stopWordSet](const WordInfo& e) -> bool
{
//WordInfo lastChar(std::wstring(1, e.Word.back()));
const wchar_t l = e.Word.back();
auto pr = [l](WordInfo const& e) -> bool {return e.Word[0] == l;};
return ov::find_if(wordSet, pr) == wordSet.end()
&& ov::find_if(stopWordSet, pr) == stopWordSet.end();
});
wordSet.erase(it, wordSet.end());
ov::sort(stopWordSet, StringFirstComparer());
}
int main()
{
std::locale l("");
std::wcout.imbue(l);
std::wstring s;
wordset_t wordSet;
wordset_t stopWordSet;
{
std::wifstream is("h:\\t.txt");
is.imbue(l);
while (is >> s)
{
dakuonReplace(s);
if (s[s.length() - 1] == L'ン')
{
stopWordSet.push_back(WordInfo(std::move(s)));
}
else
{
wordSet.push_back(WordInfo(std::move(s)));
}
}
}
ov::sort(wordSet, StringFirstComparer());
ov::sort(stopWordSet, StringFirstComparer());
boost::timer t;
AdjustStopWord(wordSet, stopWordSet);
std::wcout << L"start time: " << t.elapsed() << L'\n';
auto result = GetLongestShifitoriList(wordSet, stopWordSet);
std::wcout << L"end time: " << t.elapsed() << L'\n';
std::wcout << L"size: " << result.size() << L'\n';
ov::copy(result | ov::indirected
, std::ostream_iterator<std::wstring, wchar_t>(std::wcout, L" "));
std::wcout << std::endl;
}
|


greentea #9391() Rating5/7=0.71
一番長くしりとりを続けるためのプログラムを書いてください。
また、単語数に対して、計算量がどのように増えていくかも考えて下さい。
なお、単語リストの一例として
http://www.ais.riec.tohoku.ac.jp/lab/wordlist/index-j.htmlで公開されている
http://www.ais.riec.tohoku.ac.jp/lab/wordlist/fam55_40.txtがあります。
ただし、
・一度使った単語は使わないこと(リストに重複がある可能性は考えなくてよい)
・「ん」で終わる単語を使用するか、リスト内にしりとりを続けられる単語がなくなったときに、しりとりは終了する
・一番最初は、好きな単語から初めてもよい
・「一番長くしりとりを続ける」とは、しりとりが終了するまでに使用する単語数が最大になるよう、しりとりの単語を選ぶことをいう
see: 難聴者のための単語了解度試験用単語リスト
[ reply ]