板検索:
文字コード総合スレ Part10 (758)
まとめビュー
1
デフォルトの名無しさん[]   投稿日:2015/10/14 20:29:00  ID:xctG4AAd.net(5)
プログラマーなら一度は煩わされたことのある文字コードについてのスレ。
UTF-8、ShiftJIS、JIS、EUC、Uincode、 UCS、サロゲートペア、コードポイント、文字コード判定、
合成文字、ソート、TRON、外字コード、その他について語り合いましょう。
各言語での文字列の扱いについての質問もOKです。
基本マッターリ、ささ、茶でもどうぞ。

■過去スレ
文字コード総合スレ part1 プログラム板の別スレッドへ
文字コード総合スレ part2 プログラム板の別スレッドへ
文字コード総合スレ part3 プログラム板の別スレッドへ
文字コード総合スレ part4 プログラム板の別スレッドへ
(スレ再利用)UnicodeとUTF-8の違いは? UnicodeとUTF-8の違いは?
(隔離スレ)UnicodeとUTF-8の違いは? その2 UnicodeとUTF-8の違いは? その2
文字コード総合スレ part5 文字コード総合スレ part5
文字コード総合スレ part6 文字コード総合スレ part6
文字コード総合スレ part7 文字コード総合スレ part7
文字コード総合スレ part8 文字コード総合スレ part8
文字コード総合スレ part9 文字コード総合スレ part9
コメント1件


2
デフォルトの名無しさん[sage]   投稿日:2015/10/14 20:30:38  ID:xctG4AAd.net(5)
■参考サイト
Unicode Home Page
http://www.unicode.org/
Java Character Encodings
http://www.ingrid.org/java/i18n/encoding/
euc.JP: tech docs, BeOS tools
http://euc.jp/
IANA: Character Sets
http://www.iana.org/assignments/character-sets
Legacy Encoding Project
http://sourceforge.jp/projects/legacy-encoding/
CP50220
森山さんの説明
http://lists.sourceforge.jp/mailman/archives/legacy-encoding-talk-ja/2006...
JISX4061
日本語文字列照合順番
http://www.jisc.go.jp/

3
デフォルトの名無しさん[sage]   投稿日:2015/10/14 20:31:02  ID:xctG4AAd.net(5)
健全でない言葉が含まれているため表示しません 内容を確認する
コメント1件

4
デフォルトの名無しさん[sage]   投稿日:2015/10/14 20:31:39  ID:xctG4AAd.net(5)
・中国語の簡体字では、へんやつくりが簡略化されるなら、その文字も自動的に簡略化して表記する国家規格が有る
・中国語の「?心」簡化政策によると「?(U+6076)」に統一。口偏+?(U+6076)は普通に使われているがUnicodeにはない
・日本人のニーズが満たせないのも確かなので原規格分離(中国では「曾→曽」は簡体字と繁体字の違いとはみなされていないとか)
・UNICODEを扱うプログラムはサロゲートをぶったぎられた入力が渡されてくる場合にも備えろって→YES
・UnicodeとUTF-8の違いは?
・日本のCJK Ext.D Submissionに{魚針}が含まれてる件
 U+9C75(魚箴)は強烈。いくら何でも違いすぎる。(魚針)
 ひょっとしたら後で実は別字だったとか日本では異体字だが中国では別字とかになるかも知れんぞ。
 中国ではってレベルじゃねーぞ。
・Windows Vista での「IME パッド - 文字一覧」の「JIS X 0213 (1面)」のバグ
 UTF-16: 0x304B 0x309A → Unicode: U+FD61809A (間違い) (ISO/IEC10646はU+10FFFFまで)
 サロゲートペアからコードポイントを引き出す計算を無理やり適用(間違い)
 ((0x304B - 0xD800) << 10) + (0x309A - 0xDC00) + 0x10000が 0xFD61809A になる。
・文字コードではインドカレーは飲み物か否か。カレーパンうまうま。
・CJK混在の漢字環境ってどうやって、切り分ければいいの? → ムリです。
・Winzipで保存されるファイル名が文字化け→zipではコードページ情報が無い。直接zipファイルから切り出せ
・Unicodeは言語情報を直接扱わない。 多言語の混在表現は(unicodeでは)できないか
・Unicode文字列リストを各国言語を考慮してソートしたいんですが → ムリです。
・Unicodeサニタイズが面倒になるのか
コメント1件

5
デフォルトの名無しさん[sage]   投稿日:2015/10/14 20:31:59  ID:xctG4AAd.net(5)
・SJISとUNICODEの判別はどのようにすればいいですか?BOM。無ければ、統計判断。 ライブラリを使うが吉
・ところでケータイのUnicode対応度って実際どうよ? → ウンコマークもUnicodeに追加されるんだな。
・WindowsXP で フォルダに使用できないフォルダ名はどうやって判定
  → ちょっとアホな方法だけど、%TEMP% フォルダの下で実際に作ってみて。本当に作成できるかどうかで判断。
・TwitterのWebインターフェイスからだと、サロゲートペアは2文字としてカウント。140字打てない 。
・Unicode 5.2で追加されたUnicodeSMP(第1面)、Unicode 5.1で未定義だったSMPのコードポイントや第15、第16面が
 Windows7では表示されない。 → 和田研細丸ゴシック2004ARIBはARIB外字を含んでいる。
・WindowsXP SP3でMicrosoftのJIS2004フォント環境でサロゲートペア文字が表示されない。→
 コントロールパネル-地域と言語のオプション-[言語]タブで
 「複合文字や右から左方向に書く言語 (タイ語を含む) のファイルをインストールする」にチェック
・URLの%で続く2桁の0-9、A-Fへの変換は、UTF-8→urlencodeによる。RFC1738を嫁。
・菊紋、桐紋、葵紋などは文字か?海栗コードへの挿入は難しい。そこでTRONだ!!
・元号を安置する場所はJIS第三で確保済み。ウニコードでブロックを確保は政治力次第。
・元号は個人名ではない。特定の時間軸基準に数える年号を漢字で指す文字。
 陛下の崩御後必ずしも元号が追号になるわけではない。むしろ違う場合が多い。昭和54年法律43号の元号法参照。
・文末でなければ"0"+ASCII7ビット、文末なら"1"+ASCII7ビットというエンコード。 → ヌル1バイトが貴重な時代からの負の遺産。
・Windows7出荷時に未定義だったコードポイントはフォント入れても豆腐になる。Unicode5.2は表示しない。欝だ。
・Unicode6ドラフトでPILE_OF_POO文字確定。ウニコードがもはやイミフ。SerifとSans-Serifで幅に違いは出る?
・shift-jisからUTF-8変換でサイズ1.5倍。でも圧縮すれば平均10%増加程度。用途に合わせて使うべし。
・「wchar_tは>849の嫁。>849の許可無くしてUTF16だの32だの無理矢理突っ込むのは許さん。」
・電子演算機では文字化けなんて飾りです。UTF-8/UTF16の人にはそれがわからんのですよ。

6
デフォルトの名無しさん[shuffle]   投稿日:2015/10/14 23:23:47  ID:obUlIRbX.net


7
デフォルトの名無しさん[sage]   投稿日:2015/10/14 23:28:48  ID:+mXu/6rb.net(4)

8
デフォルトの名無しさん[sage]   投稿日:2015/10/14 23:29:44  ID:+mXu/6rb.net(4)
■ライブラリ
IBM Globalization - ICU
http://www-306.ibm.com/software/globalization/icu/
NKF32.DLL
http://www.vector.co.jp/soft/win95/util/se020949.html
バベル
http://tricklib.com/cxx/ex/babel/
バベルの文字コード判定で使ってる日本語文書内での各文字の出現頻度データです。
http://tricklib.com/cxx/ex/babel/scoremap.csv
mlang
http://msdn.microsoft.com/ja-jp/library/aa767865(en-us).aspx
iconv
http://www.gnu.org/software/libiconv/
ICU
http://www.icu-project.org/

9
デフォルトの名無しさん[sage]   投稿日:2015/10/14 23:30:41  ID:+mXu/6rb.net(4)
■単語一覧
・UTF-16は16ビット単位にエンコードするけど、サロゲートペアがある
 表現できる文字空間はUTF-8と同じく20ビットとちょっと
・丸付き数字は機種依存文字か?MSIME2007ではCP932に収録されてない文字は「環境依存文字」って表示。
 MacJapaneseではフォントによっては表示されないし、フォントによっては表示される。
今のMac(内部Unicodeアプリ)は、フォント依存ではなくアプリ依存。
似非ISO-2022-JPや似非Shift_JISのドキュメント中の丸付き数字は、
素直にAppleのAPIを使ってるアプリならゲタ(U+FFFD)になる。
・Mail.appではISO-2022-JPに収まらずCP932に収まるメールは、含まれる字種によって
 charset=CP932で送信される場合とISO-2022-JP(もどき)で送信される場合がある
・MSでのウニコードとSJIS変換のバグ。
 U+007E TILDE <-> Shift_JIS 0x7E OVERLINE
 U+301C WAVE DASH -> Shift_JIS NA 【MSの問題】
 U+FF5E FULLWIDTH TILDE <-> Shift_JIS 0x8160 WAVE DASH 【MSの問題】
・SafariでのウニコードとSJIS変換のバグ。
 U+007E TILDE -> Shift_JIS 0x8160 WAVE DASH 【Safariの問題】
 U+301C WAVE DASH <-> Shift_JIS 0x8160 WAVE DASH
 U+FF5E FULLWIDTH TILDE <-> Shift_JIS NA
・winzipの規格ではファイル名のコードページ指定もしくは記録情報が存在しない。
 解決策:取り合えず、MSWin+JPではShift-jisでファイル自体には保存されている。
 MACOSX=Unicode,Unix=UTF/EUC/S-JISどれでもありえる。文字に関係なくLocalLangで
 再変換しているので、それをしなければよい。
・charlenでの文字列長の判定はプラットフォームにより返り値が違う(機種依存文字等)。マニュアル嫁。
・JISのエスケープシーケンスが正しく認識されない本文とか。
 '0x1b, 0x24, 0x42' という3バイトを先頭に、'0x1b, 0x28, 0x42' を末尾に追加汁。
 あるいはhttp://masaka.dw.land.to/mr/jmr.phpとか。
コメント2件

10
デフォルトの名無しさん[sage]   投稿日:2015/10/14 23:31:54  ID:+mXu/6rb.net(4)
JTC1/SC2/WG2 - ISO/IEC 10646 - UCS
http://std.dkuug.dk/JTC1/SC2/WG2/

ISO/IEC JTC1/SC2/WG2/IRG
Ideographic Rapporteur Group
http://appsrv.cse.cuhk.edu.hk/~irg/

11
デフォルトの名無しさん[sage]   投稿日:2015/10/15 18:31:09  ID:xOsbEBDE.net
>4が化けてるな前スレもだが

12
デフォルトの名無しさん[sage]   投稿日:2015/10/15 18:40:33  ID:jm/ZzoYR.net
4とか5とかもう引き継がなくていいのでは
コメント2件

13
デフォルトの名無しさん[sage]   投稿日:2015/10/16 16:24:02  ID:rHUq12EW.net(2)
&amp;#x6076;

14
デフォルトの名無しさん[sage]   投稿日:2015/10/16 16:24:47  ID:rHUq12EW.net(2)

15
デフォルトの名無しさん[sage]   投稿日:2015/10/17 20:16:21  ID:E+N5KQ+e.net
文化庁の文化審議会漢字小委員会は16日、漢字の手書き文字について、「とめる」か「はらう」かなど、細部にこだわって正誤を判断せず、多様な字形を認めるべきだとする指針の中間報告案をまとめた。
コメント1件

16
デフォルトの名無しさん[sage]   投稿日:2015/10/18 22:08:48  ID:/JqZyvWj.net
明日から松江でWG2らしいけど文書非公開だと流れが追えなくてつまらんな

17
デフォルトの名無しさん[sage]   投稿日:2015/10/19 00:12:31  ID:Vwmjvaq0.net
うむつまらん

18
デフォルトの名無しさん[sage]   投稿日:2015/10/22 19:44:06  ID:HJqUYTXB.net
Unicodeおじさんがミラーしてくれた
http://www.unicode.org/wg2/docs/

Nushuが1b170からになってるってことはKana Supplementがそこまで広がったのかな

19
デフォルトの名無しさん[sage]   投稿日:2015/10/24 00:34:11  ID:5L65oHkd.net
>15
これか。
http://srad.jp/story/15/10/20/0510245/

ただでさえ漢字が多すぎて困っている。それをさらに増やすような法務省の莫迦に対する歯止めとして期待。

20
デフォルトの名無しさん[sage]   投稿日:2015/10/25 03:36:16  ID:fgAWLXG9.net
>12
同意
古いのが多すぎるし

21
デフォルトの名無しさん[sage]   投稿日:2015/10/25 12:49:19  ID:ekYyyren.net
>12
引き継がないとはどういう意味ですか?

22
デフォルトの名無しさん[sage]   投稿日:2015/10/25 18:50:42  ID:zgU7ZYeY.net
3-5と9はもうテンプレから外していいんじゃないかなって話かと

20も言うように古いし更新されてないしどういう文脈の話かわからないのもあるし
レス番指定してるレスが混じってるけどPart何スレかもわからないしよく見ると色々あれ

23
デフォルトの名無しさん[sage]   投稿日:2015/10/25 19:24:02  ID:A/UjGnAW.net
>3-5はいらないけど、しれっと>9を紛れ込ませるのは許さん

24
デフォルトの名無しさん[sage]   投稿日:2015/10/25 19:33:16  ID:8Ekj0BDy.net
>9は議論の軌跡としては正しいのかも知れないけど内容が間違いだらけなので消した方が吉

25
デフォルトの名無しさん[sage]   投稿日:2015/10/26 20:48:28  ID:hvOVpGBH.net
絵文字馬鹿のOむかつく
とっとと干されりゃいいのに

26
デフォルトの名無しさん[sage]   投稿日:2015/10/27 07:41:18  ID:ecThD4uO.net
ほんとにな
他に実績ない絵を字として登録してない?
そのうちLINEスタンプとか報道写真も登録するんじゃねえの。
一方で互換性ガー言って過去のミス登録を修正しないし。
WAVE DASH例示字形ですら25年かかるという無能揃いの組織。
過去版との互換性なんかとうの昔になくなってるのに。

27
デフォルトの名無しさん[sage]   投稿日:2015/10/27 23:40:44  ID:b1wh6dDM.net
Unicodeコンソーシアムがアレなのは否定しないってか同意だが
WAVE DASHの問題はMSが独自の変換表を使ってるからなので
正直例示字形だけ直されてもあまり意味がってか字形だけならWindows Vista以降修正されてるし
いやそりゃ正しい波の形になったから気分はすっきりするけど。

28
デフォルトの名無しさん[sage]   投稿日:2015/10/28 02:14:09  ID:6/ByidLc.net
ってか全角チルダのほうの字形(?)を上に寄せてくれんかな。
コメント1件

29
デフォルトの名無しさん[sage]   投稿日:2015/10/28 07:10:47  ID:en6I5N16.net
>WAVE DASHの問題はMSが独自の変換表を使ってるから

どうしてこういう見え透いた嘘を平気でつけるんだろうか
コメント2件

30
デフォルトの名無しさん[sage]   投稿日:2015/10/29 20:27:41  ID:Lz+b+/gX.net
>29
無知?それとも俺には問題ないという青年の主張?

31
デフォルトの名無しさん[sage]   投稿日:2015/11/02 21:17:58  ID:AsQYV5Wm.net(2)
>29
勉強し直そうね
コメント1件

32
デフォルトの名無しさん[sage]   投稿日:2015/11/02 21:18:31  ID:AsQYV5Wm.net(2)
>28
ほんまそれ

33
デフォルトの名無しさん[sage]   投稿日:2015/11/03 04:49:27  ID:i5nTnJv9.net
逆Sの記号ってなんでないんだろう?

34
デフォルトの名無しさん[sage]   投稿日:2015/11/03 05:49:15  ID:zO1n76ez.net
M?

35
デフォルトの名無しさん[sage]   投稿日:2015/11/03 07:38:16  ID:sxF23lrF.net
Ƨ

36
デフォルトの名無しさん[sage]   投稿日:2015/11/03 17:26:02  ID:P1Dl09Tr.net
クローゼットの中にそういうハンガーみたいな金具たくさん入ってるけど
どういうときに使えるのか未だにわからない。

37
デフォルトの名無しさん[sage]   投稿日:2015/11/04 00:41:30  ID:L8/5F95r.net
肩の厚みのあるハンガーをたくさんかけると、
スペースが無駄になるので互い違いに高さを変える。

38
デフォルトの名無しさん[sage]   投稿日:2015/11/04 01:28:04  ID:uMca4o1w.net
向きが90度ずれない?
S字のを2個連結すれば戻るけど2個使い前提の道具なの?

39
デフォルトの名無しさん[sage]   投稿日:2015/11/04 16:58:03  ID:QtO4ndAT.net
あれはスペースの有効活用が優先で
向きがずれる(逆になる)のは承知で使うんじゃないか?

>31
しかし、チルダの全角形を本来の意味(?)で必要としているユーザーはどれだけいるんだろうかと思う
コメント1件

40
デフォルトの名無しさん[sage]   投稿日:2015/11/05 23:49:21  ID:clXjiXU8.net
スレ違いかもしれんが
ネットで、ある日本語のテキストファイルを見たら化け化けだった
3分の1くらいのみ見れる
これをブラウザで簡体字中国語を選ぶと見れるという書き込みを見つけたので、
そうしたら見れた

これはどういうこと?
中国語扱う人が日本語をGB2312でエンコードしてたってこと?

41
デフォルトの名無しさん[sage]   投稿日:2015/11/05 23:59:17  ID:gSAo/oaU.net
ふつうに考えるとそうだろうな

42
デフォルトの名無しさん[sage]   投稿日:2015/11/06 06:30:43  ID:6Ax8SlYK.net
>39
使用頻度は気にしなくていいんだよ
全チルがあればそれでいい
あとはマッピング直してくれれば。

43
デフォルトの名無しさん[sage]   投稿日:2015/11/07 23:09:16  ID:NHx999Nj.net

44
デフォルトの名無しさん[sage]   投稿日:2015/11/08 14:35:15  ID:y8uRNach.net
お国自慢絵文字か。文字コードに押し込もうというわけでなければ、
ありふれたご当地ゆるキャラを何匹か並べたら大体同じ趣旨の日本版になるな。

45
デフォルトの名無しさん[sage]   投稿日:2015/11/08 17:13:00  ID:BjW4Fik6.net
絵文字は文字以上に定義も難しいしキリがないからユーザー外字領域に閉じ込めておけばよかったのに。

46
デフォルトの名無しさん[sage]   投稿日:2015/11/09 00:23:08  ID:loOQ2SCd.net
作った奴と押し込む奴は往々にして別、
コメント1件

47
デフォルトの名無しさん[sage]   投稿日:2015/11/09 01:28:50  ID:9QpSgphP.net
>46
?

48
デフォルトの名無しさん[sage]   投稿日:2015/11/09 07:42:22  ID:L+fm0eEi.net
さすがに、外字領域での大規模な運用ぐらいはされてないと押し込みの提案も出ないんじゃなかろうか

49
デフォルトの名無しさん[sage]   投稿日:2015/11/09 09:49:40  ID:Yjqxj+LL.net
nokiaの端末に入っちゃったんでしょう?
コメント1件

50
デフォルトの名無しさん[sage]   投稿日:2015/11/09 14:08:54  ID:wh2HsxEX.net
Unicode 10.0あたりになったら収録されるんだろうか?

51
デフォルトの名無しさん[sage]   投稿日:2015/11/09 22:16:17  ID:yLbPQAdL.net
>49
そうなの?文字として?

52
デフォルトの名無しさん[sage]   投稿日:2015/11/09 23:44:45  ID:BJx9eA+t.net
ビットコインマーク、Unicodeに収録へ | スラド IT
http://it.srad.jp/story/15/11/09/055230/
Bitcoin 'B' Approved By Computer Text Standards Body
http://www.coindesk.com/bitcoin-unicode-symbol-approval/
http://www.unicode.org/L2/L2015/15229-bitcoin-sign.pdf

53
デフォルトの名無しさん[sage]   投稿日:2015/11/10 12:10:29  ID:tU9IcOly.net
ペリカもはよ

54
デフォルトの名無しさん[]   投稿日:2015/11/11 22:12:58  ID:mDE1AFdu.net(2)



55
& ◆Pw.ZL0FkaP42 []   投稿日:2015/11/11 22:13:45  ID:mDE1AFdu.net(2)
s

56
デフォルトの名無しさん[sage]   投稿日:2015/11/11 22:23:37  ID:rMaJFptQ.net
GB2312に平仮名、片仮名が収録されているというのも不可解なもんだ。
あいつら反日、嫌日のはずなのに。

57
デフォルトの名無しさん[sage]   投稿日:2015/11/11 23:13:58  ID:oIjjO58x.net
シュエエアィサィ的な使い方を想定していたんじゃなかろうか

58
デフォルトの名無しさん[sage]   投稿日:2015/11/12 23:09:21  ID:fGMv4NR4.net
しかも簡体字フォントの仮名のデザインが脱力。
日本語版Windowsにも標準で付いている。たぶんMacにも。

59
デフォルトの名無しさん[sage]   投稿日:2015/11/13 14:48:06  ID:tDbTQZeN.net
韓国のKS C 5601(KS X 1001)にも平仮名、片仮名入ってるし
単にJIS C 6226(JIS X 0208)の構造コピーして必要なところ以外はそのまま放置しただけなんじゃ……。

60
デフォルトの名無しさん[sage]   投稿日:2015/11/13 16:17:05  ID:UEuwKYUJ.net
日本語の文章捏造するために必要だから

61
デフォルトの名無しさん[sage]   投稿日:2015/11/13 17:57:15  ID:P1S0o/po.net
GBKはX 0208をベースに作った
韓国はX 0208をパクった上に起源を主張し出した

62
デフォルトの名無しさん[sage]   投稿日:2015/11/14 12:15:58  ID:cxUMG3m7.net
そういうのは嫌韓嫌中スレでやってねw

63
デフォルトの名無しさん[]   投稿日:2015/11/14 16:21:16  ID:JBEqdozk.net
Androidでのダウンロードしたアプリのapkファイルを取り出してESファイルエクスプローラというアプリでapkファイルの拡張子をzipにして中身を見てるんだけど文字化けしてみえない
どの文字コードにしても見えない

64
デフォルトの名無しさん[sage]   投稿日:2015/11/14 16:31:04  ID:1yIT8GQx.net
文字コード関係なし

65
デフォルトの名無しさん[sage]   投稿日:2015/11/18 16:49:52  ID:UgIpz7zK.net
すみません
今ISO-IRの資料を収集してるんですが

http://www.itscj.ipsj.or.jp/ISO-IR/232mapping.txt

の対応表ファイル持ってる方いらっしゃいませんか?
PDFはサーバーにデータ残ってるみたいで保存出来たんですが
他は消されちゃったみたいなんですよね。。。

66
デフォルトの名無しさん[sage]   投稿日:2015/11/19 01:28:49  ID:Cr0FNu0Z.net

67
デフォルトの名無しさん[sage]   投稿日:2015/11/20 02:58:25  ID:n24r8VSJ.net
人名漢字など「文字情報基盤」約6万字の暫定私用コードと対応フォント公開 -INTERNET Watch
http://internet.watch.impress.co.jp/docs/news/20151117_731123.html

68
デフォルトの名無しさん[sage]   投稿日:2015/11/20 16:27:32  ID:Q3IEXjzg.net
>66
そう、これです!
ありがとうございます!

ずっと
http://www.itscj.ipsj.or.jp/〜

http://kikaku.itscj.ipsj.or.jp/〜
の方ばかり探してたんですが、
https://の方にまだあったんですね、気付かなかった。。。

ありがとうございました。

69
デフォルトの名無しさん[sage]   投稿日:2015/11/21 03:23:51  ID:YeqL1+4P.net
gbkの ひらがな はEUC-JPと互換性がある

ひらがなが含まれてるgbkなテキストファイルを自動判別すると
EUC-JPと認識される

70
デフォルトの名無しさん[sage]   投稿日:2015/11/21 06:36:56  ID:GdR6w5S8.net
お前かお前の使ってるクソソフトが認識したことを
さも普遍的であるかのように「認識される」と書かれても
コメント1件

71
デフォルトの名無しさん[]   投稿日:2015/11/21 14:00:50  ID:EEYvP2Nj.net
>70
EmEditor と 日本語しか対応してないものはすべて同様なんだが

英語圏の方がまとも

72
デフォルトの名無しさん[sage]   投稿日:2015/11/21 14:57:31  ID:w+2inzGV.net
全てって…
具体名を十個挙げてみてくれ。

73
デフォルトの名無しさん[sage]   投稿日:2015/11/22 15:40:38  ID:CReeeeGe.net
仕様と実装をごちゃ混ぜにしないでほしい
コメント1件

74
デフォルトの名無しさん[sage]   投稿日:2015/11/24 07:50:30  ID:CRysEeOZ.net
grepをutf16対応にして欲しいわ
コメント2件

75
デフォルトの名無しさん[sage]   投稿日:2015/11/24 12:09:48  ID:BW2JWDBU.net
>73
ANSI(SJIS) / JIS / EUC(EUC-JP) / UNICODE / UTF-8
だけしか対応してないんなら仕様だろうけど

EmEditorはgbk / big5も表示可能だが自動識別はダメ

76
デフォルトの名無しさん[sage]   投稿日:2015/11/24 16:09:46  ID:y63rqxtS.net
EUC系の自動判別には限界があるってだけの話じゃないのそれ

77
デフォルトの名無しさん[sage]   投稿日:2015/11/24 17:13:28  ID:AzY4Y1Jb.net
馬鹿に言ってもしょうがないんだよなあ

78
デフォルトの名無しさん[sage]   投稿日:2015/11/24 21:06:35  ID:T8a74y+F.net
文字コードの仕様の話と製品の仕様(実装)の話をごっちゃにしないでください

79
デフォルトの名無しさん[sage]   投稿日:2015/11/25 13:54:24  ID:5G4DFNSQ.net
文字化けし辛い・自動判別に強いという意味ではISO-2022-JP最強だな
コメント1件

80
デフォルトの名無しさん[]   投稿日:2015/11/25 21:01:53  ID:Bzkw7eST.net
>74
utf-8でガマンガマン

81
デフォルトの名無しさん[sage]   投稿日:2015/11/26 10:04:26  ID:esn3xG4v.net
プログラミングやマークアップで場面によって"utf8"だったり"utf-8"だったり"UTF8"だったり"UTF-8"だったりするのは何とかならんのですかね
コメント1件

82
デフォルトの名無しさん[sage]   投稿日:2015/11/26 18:52:12  ID:V1IifTg+.net
>81
それな。
動きおかしいと思ったらハイフンついてたとかある。
コメント1件

83
デフォルトの名無しさん[]   投稿日:2015/11/26 20:23:24  ID:k6+g+Go3.net
>79
https://ja.wikipedia.org/wiki/ISO-2022-JP
独自拡張しすぎだろ

utf-8最強なのだが
Win9x時代に ANSI(s-jis) + utf-8(※s-jisに無い文字をutf-8にしてる) なんてファイル作る糞ソフトがあったな
コメント1件

84
デフォルトの名無しさん[sage]   投稿日:2015/11/26 22:39:18  ID:i5VTRdPj.net(2)
>82
utf-8に関しては-が付いてておかしくなる方がおかしい。

85
デフォルトの名無しさん[sage]   投稿日:2015/11/26 22:43:40  ID:i5VTRdPj.net(2)
>83
> ANSI(s-jis)

糞表現w
コメント1件

86
デフォルトの名無しさん[]   投稿日:2015/11/26 23:24:19  ID:dmQOYIsX.net
>85
悪かったな


糞やろう。

87
デフォルトの名無しさん[sage]   投稿日:2015/11/26 23:37:04  ID:o1tgPu22.net
そんなのはプログラミングやマークアップでの指定方法の仕様次第
おかしくなると思うのはバカ

88
デフォルトの名無しさん[sage]   投稿日:2015/11/26 23:41:50  ID:1gB3GczG.net
お前が馬鹿だ

89
デフォルトの名無しさん[]   投稿日:2015/11/27 07:32:51  ID:B8BSEsh/.net
>74
がまんしないで、要望をかいたほうがいいとおもう
どういうgrepがいいのかな?
コマンドですか? GUIですか?
コマンドなら、画面の環境に依存したりする
コメント1件

90
デフォルトの名無しさん[sage]   投稿日:2015/11/27 15:43:44  ID:ssdfMMFk.net
>89
検索対象のデータだけでなく、
引数や端末のencoding systemも関係するからねえ。

91
デフォルトの名無しさん[]   投稿日:2015/11/30 21:59:17  ID:jgXroiuo.net
「して欲しい」じゃなく自分でやってみればいいのに。

92
デフォルトの名無しさん[]   投稿日:2015/11/30 22:34:12  ID:CwTedwfo.net
UTF-8って日本語はほぼ3バイトだと思っていいんだっけ?

仕事仲間がそう言ってたけど不安。

93
デフォルトの名無しさん[sage]   投稿日:2015/11/30 22:58:14  ID:/7/T57pL.net
そういう曖昧な表現なら答えはyesでありnoでもあるだろう

94
デフォルトの名無しさん[sage]   投稿日:2015/12/01 02:33:52  ID:juK8PVcx.net(2)
iconv -f Shift_JIS -t UTF-8 file_name > new_file
サイズを比較
new_fileは、file_nameより1.5倍おおきい

# 日本人にとってUTF-8がいいわけない
コメント2件

95
デフォルトの名無しさん[sage]   投稿日:2015/12/01 02:44:11  ID:juK8PVcx.net(2)
ほとんど3バイト
Japanese, Chinese and Korean characters are almost entirely (if not entirely) 3 bytes on UTF-8.

3バイトは、UTF-16をつかう理由になる。
the three-byteness of CJK characters is an often-cited reason to use UTF-16 instead of UTF-8.

http://forum.dlang.org/post/hum5gl$2hfm$1@digitalmars.com

96
デフォルトの名無しさん[sage]   投稿日:2015/12/01 03:51:29  ID:Ik5f2d1Y.net
>94-95
ファイルサイズの事を書くならもっと考慮すべきだな

UTF-8に変換するとどの程度ファイルサイズが膨らむのかは文書の内容により異なる
例えばこのスレの95までのdatファイルの場合は次のようになっていて
元のファイルに対してUTF-8は約 1.25 倍、UTF-16は約 1.5 倍だった

$ wc -c 1444822140-*
&nbsp;26775 1444822140-cp932.dat
&nbsp;40234 1444822140-utf16.dat
&nbsp;33434 1444822140-utf8.dat

ワープロなどの独自形式の内部でUCS2を使うことは十分に意味があると思う
しかしSHIFT_JISのプレーンテキストを変換する場合は、おおよそUTF-8が最大1.5倍
なのに対してUTF-16は最大2倍になる事を忘れてはいけない

97
デフォルトの名無しさん[sage]   投稿日:2015/12/01 10:01:27  ID:2Tu3vetc.net
UTF-8で日本語が基本3バイト、はもう慣れたけど
ブログやらWikiで日本語使うと1文字につき9バイト必要なのはさすがにちょっと萎える

%E3%81%8B%E3%81%A3%E3%81%B1%E3%81%88%E3%81%B3%E3%81%9B%E3%82%93

とかたった数文字を表すのに長すぎだっての。
文字コードというかUTF-8をパーセントエンコーディング?する時の問題だけれど。

98
デフォルトの名無しさん[sage]   投稿日:2015/12/01 19:29:51  ID:k1p/Pdr9.net
パーセントエンコーディングって単語自体が長くてめんどい。
もっと短く、パンコとかで通用するようにならないかな。

99
デフォルトの名無しさん[sage]   投稿日:2015/12/01 20:03:05  ID:ampHwdqN.net
別に人が手作業でやってるわけじゃないのに
なにぶつぶつ言ってるんだろ
コメント1件

100
デフォルトの名無しさん[sage]   投稿日:2015/12/01 20:18:47  ID:cchxtPU5.net
>94
そんな程度のことでutf-8を辞める訳にはいかない。

101
デフォルトの名無しさん[sage]   投稿日:2015/12/01 20:40:03  ID:RA+mqEJ1.net
>99
完全に隠蔽されてりゃいいけど
日常生活で目に入ってしまうんだから
糞としか言いようがない

102
デフォルトの名無しさん[sage]   投稿日:2015/12/01 22:44:13  ID:/t42lLyY.net
URLのパーセントエンコーディングは脆弱性の宝庫になるくらいでただ使う側としてはどうでもいいけど
punycodeはまじでやめろ

103
デフォルトの名無しさん[sage]   投稿日:2015/12/01 23:03:02  ID:csnzGfyE.net
なんでやめないといけないぷに?
いいじゃないかぷに。

104
デフォルトの名無しさん[sage]   投稿日:2015/12/02 01:31:49  ID:3/uIxAsF.net
日本語のソート順くらい日本人に決めさせろや
コメント1件

105
デフォルトの名無しさん[sage]   投稿日:2015/12/02 09:35:48  ID:wYxvpGTD.net(2)
人の感覚じゃなくて、機械的な感覚がないと・・・

106
デフォルトの名無しさん[sage]   投稿日:2015/12/02 10:05:36  ID:amR8vvu9.net
>104
提案しろよ。
そもそも読みがわからんとソート出来ないのが日本語なんで、
単漢字のソート順なんて大したこだわりないだろ。
植物、人の名前なんか、音読み、訓読み、当て読みと
二種類以上あるの珍しくないからな。

107
デフォルトの名無しさん[sage]   投稿日:2015/12/02 10:18:22  ID:wYxvpGTD.net(2)
JISコードに頼ったソートも今のコンピュータ環境じゃ、笑・・・・

脆弱性ってのは未熟もんがやるからとかでは
やりこんでる人でもバグは残ることも あ・・・

108
デフォルトの名無しさん[sage]   投稿日:2015/12/02 13:55:56  ID:NJ9kFAss.net
日本語のソート順で思い出したが、
JIS(X 0208)が第1水準と第2水準で違う並べ方してるのも意味分からん。
代表音訓でも部首画数順でもいいから統一して欲しかった。
コメント1件

109
デフォルトの名無しさん[sage]   投稿日:2015/12/04 12:30:36  ID:ujmgtERp.net
最近勉強し出したのか?
ソート順は確かに面倒だけど他の仕様との絡みを知ればこうするしかないと思う。
理想は理想で持っておけばいいんじゃね?
将来、漢字表刷新するかもしれんし、シフトJIS死滅するかもしれんし。

110
デフォルトの名無しさん[sage]   投稿日:2015/12/04 12:38:17  ID:kxI+vXrK.net
シフトJIS死滅するのは構わないが、漢字の文化的側面を理解しようともしない欧米人が適当に並べた順でソートされるのは納得いかん。
コメント1件

111
デフォルトの名無しさん[sage]   投稿日:2015/12/04 12:53:33  ID:gpSQ8UEd.net
でもJISコードなら希望通りのソートができるわけでもないだろ

112
デフォルトの名無しさん[]   投稿日:2015/12/04 14:24:16  ID:616grxEX.net
何のために仮名文字があると思っているのか。

113
デフォルトの名無しさん[sage]   投稿日:2015/12/04 18:29:07  ID:zfbjjPeM.net
文字コード順でソートしてるアホ

114
デフォルトの名無しさん[sage]   投稿日:2015/12/04 20:17:25  ID:urrQLDlj.net
いつまでたっても文字集合順序バカはいなくならないね。

全てのいじたいに

115
デフォルトの名無しさん[sage]   投稿日:2015/12/05 09:09:04  ID:0xZl9ZTr.net
半角カタカナで読みもかいておく。ひとにかいてもらうとかまぁたいへんだけど…
昇順にするとき、半角カタカナで比較して行を並べ替える

116
デフォルトの名無しさん[sage]   投稿日:2015/12/05 10:43:28  ID:oE97tTMi.net
なんでメモ蝶を保存するときに
シフトジスでなくアンジーって表示されてんの?
コメント2件

117
デフォルトの名無しさん[sage]   投稿日:2015/12/05 11:20:47  ID:VAg3AW+y.net
>116
アメリカ人がバカだから
コメント1件

118
デフォルトの名無しさん[sage]   投稿日:2015/12/05 19:58:46  ID:kjmBg6FK.net
>117
Unicodeもね。
なんで符号化方式の名前じゃなくて制定した組織の名称なのかは謎。
しかも日本語環境ならANSI(=ASCII)ですらないっていう嘘表記。

119
デフォルトの名無しさん[sage]   投稿日:2015/12/05 20:50:07  ID:K2AVyHLa.net
>116
あれアンジーって読むのか。
なんとなくアンザイとかだと思ってた。
コメント1件

120
デフォルトの名無しさん[sage]   投稿日:2015/12/06 00:47:45  ID:ods/Bdie.net
英語でもWindows-1252であってANSI関係ないけどなー
後にISO/IEC 8859-1になるものが昔ANSIのドラフトとして提案されてたってのが名前の由来らしいけど
Windowsのはそれ更に独自拡張したやつだし
コメント2件

121
デフォルトの名無しさん[]   投稿日:2015/12/06 09:58:13  ID:pIhfFp+J.net
>119
普通はアンシだけど、調べてみたらアンジでもいいみたい。

アンシ以外は聞いたことがなかった。

122
デフォルトの名無しさん[sage]   投稿日:2015/12/06 10:48:45  ID:snTz5MuC.net
お前らも意味不明な文章を見たときに
「日本語でおK」って言うだろ?
それと同じ事だ

123
デフォルトの名無しさん[sage]   投稿日:2015/12/06 11:36:05  ID:jSbqCg57.net
答えるの面倒な質問だよなw
ANSI==932じゃない
Winowsが繁体字版なら950で保存される

124
デフォルトの名無しさん[sage]   投稿日:2015/12/06 12:39:48  ID:61iq3tHI.net
>120
8859-1だけじゃなくて8859の8bit使うコーディングシステムの変種という理解だろうね。
コメント1件

125
デフォルトの名無しさん[sage]   投稿日:2015/12/07 08:05:52  ID:jRU2iLzO.net
>120
なるほど。
ドラフトに噛んでただけなのか

126
デフォルトの名無しさん[sage]   投稿日:2015/12/09 07:55:39  ID:jI2VmBLr.net(2)
というか昔はANSIが決めてISOが追認って規格がたくさんあった。
アメリカではANSIの規格名で呼び続けることもあった。

127
デフォルトの名無しさん[sage]   投稿日:2015/12/09 08:29:25  ID:Kwr/X5Fv.net
ほうほう、シフトジスもANSIが決めたのですか
それは初耳です
コメント2件

128
デフォルトの名無しさん[sage]   投稿日:2015/12/09 09:52:29  ID:jI2VmBLr.net(2)
>127
>124みたいな話でしょ

129
デフォルトの名無しさん[sage]   投稿日:2015/12/09 16:27:04  ID:lqAlbDFw.net
カメラのフィルムに書いてある数字のこと昔はASA感度って言ってたのに気が付いたらISO感度ってみんな言うようになってたなみたいな話かna

130
デフォルトの名無しさん[sage]   投稿日:2015/12/09 22:54:10  ID:wiCS3usg.net
朝感度
磯感度

131
デフォルトの名無しさん[sage]   投稿日:2015/12/10 08:01:54  ID:XGY4goXY.net
>127
えっ!?何言ってんの⁇

132
デフォルトの名無しさん[sage]   投稿日:2015/12/18 18:25:49  ID:HJbW+QnG.net
>108
NDL-70のマネだからな
http://www.wdic.org/w/WDIC/NDL-70

133
デフォルトの名無しさん[sage]   投稿日:2015/12/19 00:00:59  ID:CW6jl8Ze.net
第一水準のなんでこの漢字訓読みなんだって漢字もそれ由来なん?

134
デフォルトの名無しさん[sage]   投稿日:2015/12/19 09:33:24  ID:HazuH4Vs.net
たとえばおしえて

135
デフォルトの名無しさん[sage]   投稿日:2015/12/19 22:28:28  ID:dMkmHKK1.net
NDL-70の「扱」は「圧」と「安」の間

136
デフォルトの名無しさん[sage]   投稿日:2015/12/20 02:41:57  ID:YliIi6mv.net
あっあっあん

137
デフォルトの名無しさん[sage]   投稿日:2015/12/20 10:16:50  ID:XCzWC+ME.net(2)
しごく
こく

138
デフォルトの名無しさん[sage]   投稿日:2015/12/20 10:19:07  ID:XCzWC+ME.net(2)
音読みが表外

139
デフォルトの名無しさん[sage]   投稿日:2016/01/01 03:45:50  ID:doWmnGIT.net
あけまして

140
デフォルトの名無しさん[sage]   投稿日:2016/01/01 10:51:09  ID:w8UZcEt0.net
しめました

141
デフォルトの名無しさん[sage]   投稿日:2016/01/01 23:48:50  ID:AG0KIon8.net
ISO/IEC 10646のAmd.はもう無料公開されないのかしら

142
デフォルトの名無しさん[sage]   投稿日:2016/01/03 11:09:11  ID:dkSYzm34.net
安岡センセイ絶賛ステマ中
http://srad.jp/%7Eyasuoka/journal/599105
>MZ-80Kの文字コードはなぜ変態的だったのか

143
デフォルトの名無しさん[sage]   投稿日:2016/01/06 19:04:13  ID:JzbnS0qc.net
年寄りの昔話だな

144
デフォルトの名無しさん[sage]   投稿日:2016/01/06 20:12:47  ID:iuDSHbH+.net
書き起こして記録しておくことは大切

145
デフォルトの名無しさん[sage]   投稿日:2016/01/06 20:53:18  ID:PPpC6D2R.net
確かに。

146
デフォルトの名無しさん[]   投稿日:2016/01/15 16:58:58  ID:KQq8mMFq.net
特定機種の話でアレだが
スマホのXperiaがZ4かZ5か知らんけどUnicodeの補助文字(BMP外の文字)表示出来るようになってたわ
俺のZ3では豆腐でがっかりだったのに、いつの間に。

147
デフォルトの名無しさん[sage]   投稿日:2016/01/15 18:41:54  ID:P2RUw3PT.net
豆腐になるっていうのは普通に考えると
表示能力はあるけどフォントが無いだけだからフォント入れれば済む話では

148
デフォルトの名無しさん[sage]   投稿日:2016/01/16 01:02:26  ID:JNkmPv0K.net
何個の豆腐かにもよるんじゃなかろうか

149
デフォルトの名無しさん[sage]   投稿日:2016/01/19 13:39:56  ID:dtt1X0Ve.net
http://srad.jp/%7Eyasuoka/journal/599766

安岡センセイ荒れてるけど
Unihanフリーだから論文に使ってもいいんじゃないの?

150
デフォルトの名無しさん[sage]   投稿日:2016/01/19 20:31:34  ID:AH+kA+fr.net
使ったならちゃんとそう書けって話で
使うなということではない

151
デフォルトの名無しさん[sage]   投稿日:2016/01/22 19:46:47  ID:Eb9O6glo.net
[要出典]
てか

152
デフォルトの名無しさん[sage]   投稿日:2016/01/22 20:00:04  ID:QBUelO2B.net
アホの安岡が
『「常用漢字表と人名用漢字表を元にしてテキストを作成した[1]」のが事実なら』
と鍵かっこで強調してるというのに
日本語も読めないのかこの馬鹿(>151)は
コメント1件

153
デフォルトの名無しさん[sage]   投稿日:2016/01/25 22:08:23  ID:hLxKxz0/.net
Unicodeには常用漢字表も人名用漢字表も含まれてるから、
結局のとこ、Unihanで無問題な希ガス

154
デフォルトの名無しさん[sage]   投稿日:2016/01/25 22:37:19  ID:1JcfbMU3.net
そんな甘い考えでやっちまったんだろうなあ

155
片山博文MZ ◆T6xkBnTXz7B0 [sage]   投稿日:2016/01/29 15:58:28  ID:BQRaRgTF.net
与えられたテキストがUCS16に合致するか判定するアルゴリズムってある?

156
デフォルトの名無しさん[sage]   投稿日:2016/01/29 16:42:21  ID:aBCIPjTo.net
iconvはルールが厳しいから
入ロクおかしければ変換失敗する

157
片山博文MZ ◆T6xkBnTXz7B0 [sage]   投稿日:2016/01/30 22:17:33  ID:4i/PfDlC.net
nkfは、ライブラリとしては中途半端なんだよな。
スタティックライブラリとして利用可能にしてほしい。

158
デフォルトの名無しさん[sage]   投稿日:2016/01/31 00:56:53  ID:1gNPM3q2.net
nkfって厳密さより何となく動くこと重視してるし
変換も自然とは言いがたい独自なのあるから注意

159
デフォルトの名無しさん[sage]   投稿日:2016/02/01 00:21:45  ID:AuVBRc/d.net
ほええそういうものなのか


160
デフォルトの名無しさん[sage]   投稿日:2016/02/03 21:14:57  ID:uf0uQxAG.net(2)
シフトJISを作るときに2バイト目が0x00-7Fを避けるようにはできなかったのかな?
こうすればダメ文字問題も起こらないのに。
コメント2件

161
デフォルトの名無しさん[sage]   投稿日:2016/02/03 21:41:36  ID:Fx9BpiPG.net
>160
半角カナは1バイト
漢字は2バイト
って制約があるから無理
コメント1件

162
デフォルトの名無しさん[sage]   投稿日:2016/02/03 21:50:14  ID:mmJ5x1I8.net(2)
>161は会話のできないあすぺ

163
デフォルトの名無しさん[sage]   投稿日:2016/02/03 21:58:17  ID:mmJ5x1I8.net(2)
できなくはなかっただろうな
FFと1バイト目の半角カナを避けても
63×127=8001文字は使える
コメント1件

164
デフォルトの名無しさん[sage]   投稿日:2016/02/03 23:45:43  ID:uf0uQxAG.net(2)
Unicodeがあるのに今さらという感じはするけど
半角文字は1バイト全角文字は2バイトのままで
2バイト目が00-7Fにならない新文字コードがあってもいいと思う。
コメント2件

165
デフォルトの名無しさん[sage]   投稿日:2016/02/03 23:58:17  ID:FE/plTpc.net
そして三水四水を入れる領域が足りなくなり後のMSに恨まれると。

166
デフォルトの名無しさん[sage]   投稿日:2016/02/04 12:35:29  ID:NB0syLHO.net
>164
文字コードと符号化の違い分かってる?
そもそもシフトJISをサポートしてないソフトでシフトJISを使ったら問題出たってだけでしょ
コメント1件

167
デフォルトの名無しさん[sage]   投稿日:2016/02/04 13:06:32  ID:dTOEAfAy.net(2)
>164
もう全く必要ない

168
デフォルトの名無しさん[sage]   投稿日:2016/02/04 14:58:00  ID:pUsIARbq.net
シフトJISの反省の上に?作られたのが0x00-7FをASCIIにしか使わない日本語EUC(EUC-JP)なんだから
それでいいじゃんって気がするのだけど
そんなに半角カナが大事か

>163
ISO/IEC 2022の94*94を47*188に変換するって分かりやすさ優先でこうなったんだっけ?
コメント3件

169
デフォルトの名無しさん[sage]   投稿日:2016/02/04 16:01:14  ID:dTOEAfAy.net(2)
>168
EUCはISO 2022ルールに則っとってる
ISO 2022はすでに存在した
半角カナも使える
コメント1件

170
デフォルトの名無しさん[sage]   投稿日:2016/02/04 19:20:10  ID:EFnVMbsO.net
>169
>168は半角カナを1バイトに納めることがそんなに優先かと言ってる

>168
確証は無いけど、分かりやすさ・計算の単純さ優先の結果だと思ってた

171
デフォルトの名無しさん[]   投稿日:2016/02/04 23:06:09  ID:WWqaejBP.net
>166
もっと昔からある EUC を処理するには 8ビットクリーンなプログラムであれば事足りる。
ISO 8859 もそうだ。だからコンパイラも特別な処理などしなかった。
シフトJISもそうできなかったのかという話じゃないのか?
コメント1件

172
デフォルトの名無しさん[sage]   投稿日:2016/02/04 23:35:33  ID:gW2sFWg4.net
むしろ解釈できない文字コードを通すことがおかしい
たまたま問題が見つからなかった、コンパイラがエラーを出さずに処理を終えたからOKとするなんてアホ

173
デフォルトの名無しさん[sage]   投稿日:2016/02/05 02:34:16  ID:EN3ElRH3.net
>171
8ビットクリーンならEUC-JPを問題なく使えるかというとそうでもなくて
上位バイトと下位バイトが別れちゃう問題は発生しうる

シフトjisの「表」のあとに\を入れるみたいなバッドノウハウが目立つのでシフトJISに
問題があるように見えるのかもしれないけど、本質的には対応してないものを
勝手に使って文句言ってるだけじゃないかな
コメント2件

174
デフォルトの名無しさん[sage]   投稿日:2016/02/05 02:44:24  ID:k2yclqL8.net
上位バイトと下位バイトが別れる件はダメ文字とは別件だから
最初の人の要求に対しては問題にならない

175
デフォルトの名無しさん[]   投稿日:2016/02/06 14:03:11  ID:sR9TSGCJ.net(2)
>173
対応してないから出来ないなんてことが起こるのはシフトJISだけだよ。
ダメ文字のせいで正規表現すら書けない。誰もやりたがらないような裏技はあるけどね。

176
デフォルトの名無しさん[sage]   投稿日:2016/02/06 15:14:13  ID:zVjqWScH.net
自分が間違ったやり方をしていたけど問題になったのはAだけだ
→だからAが悪い

まさにこういう発想がクソ
しかも自分の知っている文字コードが全てだと勘違いしていてたちが悪い
コメント1件

177
デフォルトの名無しさん[sage]   投稿日:2016/02/06 15:45:39  ID:P3+owK3w.net
ビットマップのフォントデータ(16×16)を使って
レトロな電光掲示板を作ってみよう、と思う
http://i.imgur.com/owubbp4.png

178
デフォルトの名無しさん[sage]   投稿日:2016/02/06 18:59:39  ID:Ps0oIAyd.net
UTF-8なら漢字やかなに00-7Fは使わないけどな
って、そういう話をしてるわけじゃないのか。
コメント1件

179
デフォルトの名無しさん[sage]   投稿日:2016/02/06 19:36:29  ID:uSRKfZgb.net
>176
しかしShift JISはかなり質が悪い

180
デフォルトの名無しさん[sage]   投稿日:2016/02/06 19:41:15  ID:MiOvJZDJ.net
どうしてWindowsは出来の悪い方ばっかり選択するんだろうか
cp932といいUTF-16といい…
コメント1件

181
デフォルトの名無しさん[]   投稿日:2016/02/06 20:34:21  ID:sR9TSGCJ.net(2)
>178
そういう話をしてるつもりだけど、そうでない人もいるようだ。

182
デフォルトの名無しさん[sage]   投稿日:2016/02/07 08:00:22  ID:+iI8pPYd.net(2)
エスケープシーケンスよりCP932の方がまだマシだし、
CP932よりUCS-2の方が多少はマシだったからでしょ

183
デフォルトの名無しさん[]   投稿日:2016/02/07 13:34:15  ID:COqNuXpv.net
>173
今更だけど、文字が分断される可能性についても公平を期すために触れておくよ。
単純にバイト数で分割する場合等を除けば、ほとんどはパターンマッチにおける誤マッチが原因だろう。
strchr や strstr 、あるいはもっと高度なライブラリを使った結果かもしれない。
探すパターンに [\100-\176] にマッチする文字が含まれているなら EUC では誤マッチは起こらない。
シフトJISではダメ文字のせいで誤マッチが起こりうる。
実際に問題になるのはほとんどがこのケース。
grep "\]"
などとやろうものなら悲惨なことになる。
探すパターンがマルチバイト文字だけなら EUC でもシフトJISと同程度には誤マッチが起こりうる。
しかし実際にはほとんど起こらない。
もちろん起こるときは起こるし対策も出来るが対策は速度の低下と引換だ。
30 年前の CPU クロックは 10MHz 程度だったので速度も重要だった。
ほとんど起こらない上に致命的でもないなら速度を犠牲にしてまで常に対策を講じる必要は無い。
ちなみに対策だが、EUC で grep する場合なら
egrep "^([\000-\177]|\216[\240-\337]|\217[\241-\376][\241-\376]|[\241-\376][\241-\376])*$pattern"
的なことをするプログラムを grep_euc とかそういう名前で作っておけばいい。
シフトJISの場合はこれに加えてシフトJISな部分を 8 進エスケープシーケンスに置き換える必要がある。
同じやり方で iso-2022-jp も処理できる。
シフトJISしか通さない grep など技術的には邪魔なだけだよ。
コメント2件

184
デフォルトの名無しさん[sage]   投稿日:2016/02/07 13:49:06  ID:GW5WZ8T2.net
>183
長文の駄文乙
文字処理を文字単位でなくバイナリデータで行うのをやめた方がいいぞ
コメント1件

185
デフォルトの名無しさん[sage]   投稿日:2016/02/07 15:37:08  ID:F/ILMG/l.net
>183
"\]"←おおESC、これでアニメ作ったもんじゃ

>184
ビット操作は頭の体操になるよ↓
http://i.imgur.com/ibjeaA8.png

186
デフォルトの名無しさん[sage]   投稿日:2016/02/07 20:14:33  ID:lDI02uIo.net
grepはいつutf16対応してくれるんじゃぁ
ふだんLinux使ってるんだがwinのソースコードはなぜかutf16なんでいつも困っとるんじゃぁ
nkfで変換するのめんどいんじゃあ

187
デフォルトの名無しさん[sage]   投稿日:2016/02/07 21:05:14  ID:+iI8pPYd.net(2)
utf16のそーすとか見たこと無いな
コメント1件

188
デフォルトの名無しさん[sage]   投稿日:2016/02/08 01:36:20  ID:0XuKQtD5.net
>180
UTF-16はそのころUCS-2しかなかったんだから仕方ないやろ

個人的にWindowsはAとWはそのままでもいいから
標準CライブラリとC++ライブラリはUTF-8を使ってくれるようにしてくれれば不満ないんだけどな。
コメント1件

189
デフォルトの名無しさん[sage]   投稿日:2016/02/08 05:19:47  ID:x/5r9wp6.net
>188
全然仕方なくないどころか、むしろまた先走ってやっちまったとしか

190
デフォルトの名無しさん[sage]   投稿日:2016/02/08 09:34:53  ID:AxqrebA9.net
健全でない言葉が含まれているため表示しません 内容を確認する

191
デフォルトの名無しさん[sage]   投稿日:2016/02/08 22:30:39  ID:ti0XuUyR.net
EUCは目糞鼻糞だし、当時の記録媒体でUTF-8とか頭おかしいレベルなのに
一体どうしたかったのか
コメント1件

192
デフォルトの名無しさん[sage]   投稿日:2016/02/08 22:35:16  ID:HMUrPVh/.net
ただマイクロソフトを非難したいだけのキティGUYに何を。
こういうのは誰でもいいから攻撃対象を設けてガス抜きさせてやらないといかん。

193
デフォルトの名無しさん[sage]   投稿日:2016/02/08 23:02:30  ID:sawB/DI+.net
SHIFT_JISよりEUC-JPの方がマシ、UTF-16よりUTF-8の方がマシってだけでしょ
マイクロソフトを非難したいだけに見えるとしたら相当なバイアス掛かってると思うよ

194
デフォルトの名無しさん[sage]   投稿日:2016/02/09 00:48:21  ID:TCPuRlam.net
>191
> 当時の記録媒体でUTF-8とか頭おかしいレベルなのに

kwsk

と言っても
> EUCは目糞鼻糞だしょ
なんて言ってる奴のいうことが理解できるかどうか…

195
デフォルトの名無しさん[sage]   投稿日:2016/02/09 05:16:13  ID:K12Uxl59.net(3)
UTF-8のRFCが出たのは2003年
その頃には80GBのHDDを一般人が変える時代
テキストの容量が問題になるとか無いわ

個人的にはいつまで経ってもsetlocaleでUTF-8を指定出来ない、代替の方法も用意されないWindowsは非難されて当然だと思うけどな。

196
デフォルトの名無しさん[sage]   投稿日:2016/02/09 07:15:08  ID:4WJVGAJH.net
Windowsの今の文字コードの設計のベースは1991年か1992年に
Unicode1.0.0をもとに作られたはず

ちなみにその頃から「〜」はU+FF5Eに存在した

197
デフォルトの名無しさん[sage]   投稿日:2016/02/09 07:20:39  ID:AjhTI0tJ.net(3)
当時の記録媒体言ってるのはWindowsNTの時代な
その当時にUTF-8みたいな実装してもアホでしょ

それとUTF-8を率先して使用してる理由ってEUC環境が糞だったからでしょ
EUC環境の時代って外人様のソフトウェアで漢字の表示すらままならなかったよね

198
デフォルトの名無しさん[sage]   投稿日:2016/02/09 07:37:26  ID:AjhTI0tJ.net(3)
まあなんにせよUnicodeでデータ交換できるようになって
EUCゴミ環境が消えテクノは良い事だわ
EUCありがとうバイバイ

199
デフォルトの名無しさん[sage]   投稿日:2016/02/09 08:47:31  ID:K12Uxl59.net(3)
同じようにWindowsのCP932もさっさと消えてほしいんだけどな

200
デフォルトの名無しさん[sage]   投稿日:2016/02/09 11:12:55  ID:nhb546WZ.net
今でも新規作成の全文章を統計取ると、
cp932の方が多いんじゃないか。
結局全くプログラムかかないひとが
何の文字コード使ってるかが焦点で、
プログラム書く人間の文字コードなんざ焦点じゃないんだよね。
コメント1件

201
デフォルトの名無しさん[sage]   投稿日:2016/02/09 11:31:59  ID:gJW4evIq.net(2)
>200
最多はwordでunicodeでしょ
ちなみにwordをunicode化したのは日本人

202
デフォルトの名無しさん[sage]   投稿日:2016/02/09 11:32:56  ID:gJW4evIq.net(2)
MSは昔からAPIを移行改善していくのが下手


203
デフォルトの名無しさん[sage]   投稿日:2016/02/09 22:21:12  ID:K12Uxl59.net(3)
電話用のWindowsもCP932とUTF16ならそのまま安らかに死んでほしいんだけどどうなん?

204
デフォルトの名無しさん[sage]   投稿日:2016/02/09 22:44:37  ID:AjhTI0tJ.net(3)
死ぬことはないよ
生まれてすらいないからね

205
デフォルトの名無しさん[sage]   投稿日:2016/02/10 05:29:25  ID:ShaMeiRT.net
産まれる前に死ぬってあると思うけど?

206
デフォルトの名無しさん[sage]   投稿日:2016/02/10 20:10:05  ID:NIAqtvX5.net
文字コードはUnicodeで統一されつつあるけど
改行コードが統一される動きはないよな
コメント1件

207
デフォルトの名無しさん[sage]   投稿日:2016/02/10 20:11:34  ID:jTWkF3R0.net(2)
>187
英語だけなら問題ないが日本語でコメントかくととたんにやっかい
おそらくwinの内部処理がutf16なんでvcでコンパイラ作る→utf16しか受け付けない
になるんだと思う

208
デフォルトの名無しさん[sage]   投稿日:2016/02/10 20:14:06  ID:DqOeVQNQ.net(2)
何言ってんだこいつ
コメント1件

209
デフォルトの名無しさん[sage]   投稿日:2016/02/10 20:19:14  ID:urcLBA+T.net
おまえはお馬鹿な発言する人にいつもくってかかるのか
コメント1件

210
デフォルトの名無しさん[sage]   投稿日:2016/02/10 20:27:11  ID:jTWkF3R0.net(2)
>208>209
バカ乙

211
デフォルトの名無しさん[sage]   投稿日:2016/02/10 20:58:07  ID:DqOeVQNQ.net(2)
絵に描いたような「バカと言う奴がバカ」
コメント1件

212
デフォルトの名無しさん[sage]   投稿日:2016/02/10 22:46:23  ID:MNP/EF3f.net
最近のMSVCはUTF-8のソースコード食ってくれるよ
新しくMSVCで読み込んだソースがUTF-8なのにBOMがないと自動判定に失敗して意味不明なコンパイルエラーになることも多いけど
コメント1件

213
デフォルトの名無しさん[sage]   投稿日:2016/02/11 00:53:59  ID:V6zkYN3z.net
>206
そうか?
ローカルデータで復帰付けてるのWindowsくらいじゃないか?
HTYP, SMTPなんかは復帰改行だけど

214
デフォルトの名無しさん[sage]   投稿日:2016/02/11 21:55:56  ID:xlY9kt9Q.net
1バイトの英数字を平仮名と同じ幅で表示するフォントがあれば
全角英数字は使わないと思うんだが全角英数字も互換性のためだけに残されていると考えていいのか
コメント1件

215
デフォルトの名無しさん[sage]   投稿日:2016/02/11 23:11:32  ID:e91ojKTo.net(2)
>214
JIS X 0208は、ASCIIやJIS X 0201と併用せずに使うことも想定されてる
だから文字集合に英数記号が含まれるのは当然
併用する場合ISO 2022的には重複符号化禁止だから本来使っちゃいけない
けど運用では守られてなかったし、併用前提の文字コードもあった
Unicodeは過去の利用例をほぼ取り込むのが前提だから
互換文字として全角文字を取り込んだ

216
デフォルトの名無しさん[sage]   投稿日:2016/02/11 23:19:16  ID:sKuqfOHl.net
ではU+3000が互換文字領域に無いのは何故なんだぜ

217
デフォルトの名無しさん[sage]   投稿日:2016/02/11 23:22:30  ID:e91ojKTo.net(2)
なんとか空白はどうしても入れたい奴があったから全部入れることにしたんじゃないのかね
最初から20種類くらいあったでしょ

218
デフォルトの名無しさん[sage]   投稿日:2016/02/12 00:18:36  ID:VRdJSDW+.net
つまり全角を貫いたおおたさん大勝利ってことだな

219
デフォルトの名無しさん[sage]   投稿日:2016/02/12 14:58:04  ID:E8URvzDX.net
空白もそうだけど横棒も統合せずに放り込んだのが多すぎ
U+2015 HORIZONTAL BARってどこから生えて来たんだろ

220
デフォルトの名無しさん[sage]   投稿日:2016/02/12 22:43:58  ID:06flQvvq.net
VERTICALなら生えてきそうだけどHORIZONTALに生えるイメージは無いな

221
デフォルトの名無しさん[sage]   投稿日:2016/02/13 10:24:02  ID:vrowrAaX.net
————
――――
コメント1件

222
デフォルトの名無しさん[sage]   投稿日:2016/02/13 21:46:29  ID:UfGCg9+I.net
>211
先に208でバカにしてきたのは208なんだが語るに落ちてねーか?
それとも「バカという単語は書いてないから自分はセーフ」ってことだろうか
バカの考えることはわからん

223
デフォルトの名無しさん[sage]   投稿日:2016/02/13 21:50:44  ID:DWYdQVEl.net
バカの考えること=お前の考えること

自分が何考えてるかもわかんないなら救いようがないな。清原と一緒に逮捕されてろ
コメント1件

224
デフォルトの名無しさん[sage]   投稿日:2016/02/15 00:32:04  ID:ntkpNKWd.net
>212
もうすぐUpdate2で改善されるからそれまで待て

225
デフォルトの名無しさん[sage]   投稿日:2016/02/15 16:58:33  ID:4pgZ8RvT.net
>221
上がU+2014 EM DASHで
下がU+2015 HORIZONTAL BAR?
EM DASHは並べても切れて見えるなフォント次第だろうけど

226
デフォルトの名無しさん[sage]   投稿日:2016/02/16 07:17:36  ID:XdPvZNKx.net
>223
なんだ適当に言葉並べてるだけか
人工無能の方がマシだなこりゃ
おバカさん

227
デフォルトの名無しさん[sage]   投稿日:2016/02/20 22:49:46  ID:2GCqu0fo.net
MS-excelのcodeという関数の出力がShift-JISだと勘違いしていた初心者の俺。
あやうく大恥をかく前に気づいてセーフ。

228
デフォルトの名無しさん[sage]   投稿日:2016/02/24 01:54:36  ID:hnpOvXF7.net
UNICODEが年々キモくなるんですけど、新しいモジコードは開発されていますか(´・ω・`)?
コメント2件

229
デフォルトの名無しさん[sage]   投稿日:2016/02/24 12:06:50  ID:9rhAu1z5.net
>228
君の出番だよ
君が第二の坂村健だ

230
デフォルトの名無しさん[sage]   投稿日:2016/02/24 17:55:57  ID:zehZo7UI.net
完成してMicrosoftとAppleとGoogleとLinuxが採用したら知らせてくれ

231
デフォルトの名無しさん[sage]   投稿日:2016/02/24 20:07:26  ID:Tso1kbi5.net
バイトオーダーがややこしいから1byteを1bitにするか
逆に1byteを64bitなどの大きい値にしたらどうよ?
コンピューターの黎明期は1byteが8bit以外の物もあったんだから
それも不可能ではないだろう。
コメント1件

232
デフォルトの名無しさん[sage]   投稿日:2016/02/24 20:26:02  ID:JXxoXIUe.net
馬鹿って馬鹿だよね

233
デフォルトの名無しさん[sage]   投稿日:2016/02/25 00:25:47  ID:loBITXzr.net
>231
コンピュータの黎明期はbyteと云う単位ではなくて、Wordという単位だったと
思いますよ。1word何byteとかいっていて、コンピュータによって、Wordのbit数が
違っていたように思います。
大体1短Wordが20bit+1符号bit,1長wordが短wordの2倍で40bit+1符号bitというのが
普通だったとおもいますが、CDCの3600は、1短wordが32bit、1長wordが64bitではなかった
かと思います。
なにしろ、1960年代のことなので、記憶違いがあるかもしれません。

234
デフォルトの名無しさん[sage]   投稿日:2016/02/25 20:46:03  ID:BzGy0Z9t.net
Unicodeに何が追加されようと大半の日本語フォントはAdobe-Japan1-6準拠だから
ほとんど恩恵がない
AdobeはPanCJKなんて漢字マニアしか喜ばないものを作ってないで
そろそろAJ17に取り掛かってくれ

235
デフォルトの名無しさん[sage]   投稿日:2016/02/26 12:15:47  ID:YTHIspbV.net
Wordは今でも使うだろ普通に。
昔あったのはWord機、生き残りがByte機。
コメント1件

236
デフォルトの名無しさん[sage]   投稿日:2016/02/26 17:03:45  ID:iAHBb9xH.net
>152
安岡センセイ大敗北w
http://srad.jp/%7Eyasuoka/journal/600756

237
デフォルトの名無しさん[sage]   投稿日:2016/02/26 19:35:56  ID:Ckpzri88.net
>235
byteかwordかというのは
アドレッシング
アクセス最小単位
アラインメント
と3つの軸があって
最後のはbyte単位でないのが主流
コメント1件

238
デフォルトの名無しさん[sage]   投稿日:2016/02/26 19:54:30  ID:d58rhTQn.net
キモはアルゴリズムでデータソースでしかないものに文句つけてもイチャモンでしかないだろう
知らんけど

239
デフォルトの名無しさん[sage]   投稿日:2016/02/26 21:57:25  ID:jlaESRTF.net
アルゴリズムもバグってるみたいよ

240
デフォルトの名無しさん[sage]   投稿日:2016/02/27 01:15:53  ID:1kXiMiWp.net
>237
アーキテクチャ上は最後のも大丈夫なんじゃないの?
メモリにアクセスするハードウェア側のインタフェースの話じゃないよね。

241
デフォルトの名無しさん[sage]   投稿日:2016/03/02 11:22:17  ID:5SSZmY+T.net
カタカナが多すぎて頭こんがらんがってきた

242
デフォルトの名無しさん[sage]   投稿日:2016/03/02 13:37:01  ID:H2CN+/B0.net
トゥゲザーしようぜ

243
デフォルトの名無しさん[sage]   投稿日:2016/03/02 13:52:03  ID:Pi6Moa3o.net
シェアしたいと思います

244
デフォルトの名無しさん[sage]   投稿日:2016/03/04 11:07:29  ID:aAJqKKxk.net(2)
1文字に32bit使うなら一般的な組み合わせの合成文字は
全て合成済み文字にしてコードを割り当てても足りるんじゃないだろうか
そうして合成文字は外字のようなオプション的な扱いにしたらいいと思うんだけどね
コメント1件

245
デフォルトの名無しさん[sage]   投稿日:2016/03/04 11:29:46  ID:ex0V5X9T.net
何のいみがあるのかわからんなあ
コメント1件

246
デフォルトの名無しさん[sage]   投稿日:2016/03/04 12:41:46  ID:aAJqKKxk.net(2)
>245
一般的な文字では32bit固定長にできる

247
デフォルトの名無しさん[sage]   投稿日:2016/03/04 13:27:03  ID:qO6Wo8x7.net
「一般的な組み合わせ」が不変ならいいけど、現実にはいくらでも流動しちゃうのが問題じゃないかな。
これまでにも「今の用途ならこれだけあれば十分」って感覚で半端に作られた負の遺産がたくさんあるよね。

合成文字の仕組み自体を全廃・強制力付きで禁止するのならともかく、
オプションとして残すのなら新たに余計なものを作っただけで終わるのが見えてる。

248
デフォルトの名無しさん[sage]   投稿日:2016/03/04 18:21:11  ID:IERVyLvo.net
ISO/IEC 6937対ISO/IEC 8859シリーズの戦いはもう勘弁

249
デフォルトの名無しさん[sage]   投稿日:2016/03/15 10:56:22  ID:ZYJuXZMf.net
>228
Unicodeで得られた知見を基に反省を活かして新しいのを作ってほしいね。
Unicodeもコンセプトは賛成だし規格に例外は付き物だけど、あまりにも継ぎ接ぎだらけでスパゲティコードみたいになってるのは清算したいね。

250
デフォルトの名無しさん[sage]   投稿日:2016/04/02 13:20:35  ID:raCNCQWh.net
Unicodeはバージョンアップ時に精算するのが得意な方
切り捨てバンザイ主義
これ以上切り捨てたら誰も使ってはくれない

251
デフォルトの名無しさん[sage]   投稿日:2016/04/06 17:49:51  ID:APP4s98L.net
UTS #52: Unicode Emoji Mechanisms
http://www.unicode.org/reports/tr52/tr52-1.html

> 3.5 Hair Attribute
>
> Syntax
>
> Tag-Base   Hair_Base
> Tag-Key    Tag-H
> Tag-Value   Exactly one of the following tag-valueChars:
>        tag-valueChar Description
>        Tag-k Black-haired
>        Tag-s Blonde (also sandy-haired)
>        Tag-b Brown (Brunette)
>        Tag-r Redhead (Ginger)
>        Tag-g Gray-haired
>        Tag-n Bald (no hair)

漫画・アニメキャラ用に赤髪、ピンク髪、緑髪、青髪、水髪、紫髪なんかも加えるべきじゃないですかね。
コメント1件

252
デフォルトの名無しさん[sage]   投稿日:2016/04/06 18:29:57  ID:qW+LkY/S.net
_人人人人人人人_
> Bald (no hair) <
 ̄Y^Y^Y^Y^Y^Y^Y ̄

253
デフォルトの名無しさん[sage]   投稿日:2016/04/08 13:36:54  ID:9VpqQ38l.net
Δ彡⌒ミΔ
ξ ・ェ・ ξ
ξ    ξ
ξ    ξ  また髪の話してる。
ξ    ξ
ξ    彡⌒ミ
ξ    (´・ω・`)〇
ξ    (|   |)ξ
ξ    (γ / ξ
 uu〜〜〜し uu

254
デフォルトの名無しさん[sage]   投稿日:2016/04/09 00:11:15  ID:QiRGiLFx.net
毛の色と量は別のパラメータだよね

255
デフォルトの名無しさん[sage]   投稿日:2016/04/09 00:17:51  ID:EyctzspR.net
赤毛のつるっぱげと
黒髪のつるっぱげと
ブロンドのつるっぱげの
区別を付ける意味はあるのかなあ。

256
デフォルトの名無しさん[sage]   投稿日:2016/04/09 01:58:16  ID:ncpORidQ.net
眉毛の色も変わるんじゃね

257
デフォルトの名無しさん[sage]   投稿日:2016/04/11 18:05:35  ID:qAYYUQ+e.net
>251
色はスタイルシートとか他の技術で実現しろよな
そのうちRGB指定とか出てくるぞこれ

258
デフォルトの名無しさん[sage]   投稿日:2016/04/19 18:55:29  ID:y8aUhLXK.net
コンソーシアムはアホばっか。
結局駆け引きとかゲーム楽しんでるだけじゃん。

259
デフォルトの名無しさん[sage]   投稿日:2016/04/22 16:03:00  ID:20ytlDG9.net
ヘアスタイルや髪の色、眼鏡やら帽子やらはUnicodeの範囲の対象外だよとか言ってたのは何だったんだろう

260
デフォルトの名無しさん[sage]   投稿日:2016/04/28 04:05:36  ID:m6Hq/pUS.net
完全にMark Davisに振り回されてる

261
デフォルトの名無しさん[sage]   投稿日:2016/04/30 16:00:17  ID:Hd4l7uwV.net
禿は髪の色じゃなくてヘアスタイルだろ
てっぺん禿、後退禿、つるっ禿と種類もある
禿差別が凄い

262
デフォルトの名無しさん[sage]   投稿日:2016/04/30 16:37:37  ID:n4ETaU8X.net
ちょんまげとか辮髪とかと同列のタグだよね

263
デフォルトの名無しさん[sage]   投稿日:2016/05/01 09:46:27  ID:w66eLaS8.net
イラストのための仕様拡張なんか合理的な理由が全くないわ
文字から切り離して絵のフォーマットにすればいいじゃん

264
デフォルトの名無しさん[]   投稿日:2016/05/01 11:04:17  ID:tKi6j9CT.net
匿名通信(Tor、i2p等)ができるファイル共有ソフトBitComet(ビットコメット)みたいな、
BitTorrentがオープンソースで開発されています

言語は何でも大丈夫だそうなので、P2P書きたい!って人居ませんか?

Covenantの作者(Lyrise)がそういう人と話したいそうなので、よろしければツイートお願いします
https://twitter.com/Lyrise_al

ちなみにオイラはCovenantの完成が待ち遠しいプログラミングできないアスペルガーw


The Covenant Project
概要

Covenantは、純粋P2Pのファイル共有ソフトです

目的

インターネットにおける権力による抑圧を排除することが最終的な目標です。 そのためにCovenantでは、中央に依存しない、高効率で検索能力の高いファイル共有の機能をユーザーに提供します

特徴

Covenant = Bittorrent + Abstract Network + DHT + (Search = WoT + PoW)

接続は抽象化されているので、I2P, Tor, TCP, Proxy, その他を利用可能です
DHTにはKademlia + コネクションプールを使用します
UPnPによってポートを解放することができますが、Port0でも利用可能です(接続数は少なくなります)
検索リクエスト、アップロード、ダウンロードなどのすべての通信はDHT的に分散され、特定のサーバーに依存しません

265
デフォルトの名無しさん[]   投稿日:2016/05/18 02:04:12  ID:rFetSORz.net
 
      彡 ⌒ ミ
      (´・ω・`)
        U θ U  
    / ̄ ̄機院院
   |二二二二二二二|
   |        |


266
デフォルトの名無しさん[sage]   投稿日:2016/06/07 17:21:48  ID:zLlkZGBv.net
http://www.unicode.org/emoji/charts/emoji-released.html#food-prepared
たこ焼きはまだか?

267
デフォルトの名無しさん[sage]   投稿日:2016/06/08 01:10:51  ID:mh0+02By.net
NAUSEATED FACEってなんや。
外人は体調悪くなるとみんな顔緑色になるんか。

268
デフォルトの名無しさん[sage]   投稿日:2016/06/08 11:35:15  ID:XFtKz/Go.net
この調子でどんどん絵文字を追加していくと
ついには新しい表意文字の体系が出来上がるよね
だけどコンピュータで扱う上では表音文字の方が合理的だったってことは
我々は痛いほどよくわかっているから、なんだかなーって気持ちになる
全ての物を一文字で表すのは大変なので
将来的に絵文字の熟語とか編み出されて
絵文字で会話するようになったらいやだなぁ
コメント1件

269
デフォルトの名無しさん[sage]   投稿日:2016/06/09 11:33:55  ID:QkRZyBjx.net
>268
>全ての物を一文字で表すのは大変なので

中国人「歓」

>将来的に絵文字の熟語とか編み出されて
>絵文字で会話するようになったらいやだなぁ

中国人「可不是」日本人「成程ね」

270
デフォルトの名無しさん[sage]   投稿日:2016/06/20 16:59:01  ID:KYxI40Xs.net
http://d.hatena.ne.jp/NAOI/20080623/1214211959

絵文字の人物の肌の色やら髪の色を区別するならこういうのも区別してほしいわ〜。
バケツ頭かそうでないかは重要、俺的に

271
デフォルトの名無しさん[sage]   投稿日:2016/06/21 12:33:04  ID:hiJvGdgU.net
unicode例示図形の画力の低さが光る

272
デフォルトの名無しさん[sage]   投稿日:2016/06/22 14:24:00  ID:veMK4+iv.net
The Unicode Blog: Announcing The Unicode® Standard, Version 9.0
http://blog.unicode.org/2016/06/announcing-unicode-standard-version-9...

Unicode 9.0.0
http://www.unicode.org/versions/Unicode9.0.0/

273
デフォルトの名無しさん[sage]   投稿日:2016/06/22 16:17:18  ID:VKcfRnsb.net
なんか最近どんどん数字上がってね?Chromeみたい。
どんどんメジャーバージョン上げていく理由って何?
コメント1件

274
デフォルトの名無しさん[sage]   投稿日:2016/06/24 07:30:00  ID:DNjTkSpS.net
>273
絵文字量産してるからな
ろくすっぽ審議もせずどんどん入れてる
絵文字専用コードにすればいいのに

275
デフォルトの名無しさん[sage]   投稿日:2016/06/24 21:07:43  ID:BJd4+ABn.net
本当、Unicode 1.X でやめとけば世の中平和だったのに。

276
デフォルトの名無しさん[]   投稿日:2016/06/26 01:00:56  ID:jrvEZcpa.net
まあ、サロゲートペアは無くても結合文字があるんですけどね……。

277
デフォルトの名無しさん[sage]   投稿日:2016/07/04 14:48:24  ID:D0uzD5G8.net
ISO/IEC 10646:2014/Amd.2:2016がいつの間にか無料公開始まってたのな。
U+301C WAVE DASHの字形がISO/IEC 10646側でもやっと修正されたのか。

278
デフォルトの名無しさん[sage]   投稿日:2016/07/06 10:23:17  ID:lhUlUm2p.net
安岡センセイ荒れてるな

http://srad.jp/~yasuoka/journal/604190/
>UTF-8は、ASCIIコードに当たる部分は1バイトで表し、
>それ以外の文字を2〜6バイトの可変長で表します。
>しかし、UTF-8ではUCS-2の範囲の文字しか扱えません。

荒れるの当然か
コメント3件

279
デフォルトの名無しさん[]   投稿日:2016/07/06 11:21:22  ID:X105+0ra.net
これはひどい

280
デフォルトの名無しさん[sage]   投稿日:2016/07/06 19:46:06  ID:j7TfNCeT.net
まじか。utf16採用してるwindows大勝利だな
(何度も言うがなんでutf8にしなかったんだよ。unixのツール使えなくてムカつくわ)
コメント1件

281
デフォルトの名無しさん[]   投稿日:2016/07/06 20:19:51  ID:gBn7auOK.net
>280
表面はSJISだからだろ。

282
デフォルトの名無しさん[]   投稿日:2016/07/06 22:02:39  ID:wyF/Ksyo.net
漢字を正確に言葉で伝えるにはコードで表現するのが最も手軽で確実だと思うのだが、
あいにく当方の職場では誰もそうしようとしない。
和文通話表もアルファベットのフォネティックコードも使わない。
何しろ管理職にそういう発想が全くないのだからどうしようもない。

今のジジババはもう駄目だ。これからの若い世代に期待したい。
コード関係者、教育関係者の皆様、文字コードの概念を広く普及させてくださいませ。

283
デフォルトの名無しさん[sage]   投稿日:2016/07/06 22:43:23  ID:7tNa29hq.net
>278
合ってるで
コメント1件

284
デフォルトの名無しさん[sage]   投稿日:2016/07/06 23:02:26  ID:73ByLRkJ.net
文字コードの話題で、他の規格に不寛容・攻撃的な人が多いのはなんでなんだろうねぇ?
mohtaの呪い?
コメント1件

285
デフォルトの名無しさん[sage]   投稿日:2016/07/07 02:40:42  ID:p2jZ7JSr.net
たまにはEBSDICの事も思い出してあげてください

286
デフォルトの名無しさん[sage]   投稿日:2016/07/07 04:21:45  ID:iN/cSWGV.net
ヱビス?

287
デフォルトの名無しさん[]   投稿日:2016/07/07 07:50:53  ID:zLr8XHI6.net
>285
エビスでなく、

EBCDIC

288
デフォルトの名無しさん[sage]   投稿日:2016/07/07 08:09:28  ID:Xq4hCxWT.net
攻撃的はそうだけど、不寛容な人はあまり見かけないな。
それから、出所不明の誤ったことを自信満々に広めようとする人は多い。

289
デフォルトの名無しさん[]   投稿日:2016/07/07 11:28:32  ID:77RIzO9k.net
>284
半角カナ気違いのトラウマだろうね

290
デフォルトの名無しさん[sage]   投稿日:2016/07/07 23:08:15  ID:Fnd7xREL.net
昔、カナ漢字変換の機能が貧弱だった頃、第2水準漢字のほとんどは
コード直接入力じゃないと出せなかったらしい。
その時代を知っているジジババはむしろ若者よりもコードの知識があるかも。
コメント3件

291
デフォルトの名無しさん[]   投稿日:2016/07/08 00:08:00  ID:oeqNGrjL.net
>290
その時代にワープロを使っている人間が少なすぎる。

292
デフォルトの名無しさん[sage]   投稿日:2016/07/08 09:37:59  ID:RQ/bQ+xA.net
いまでも第2水準の読めないような漢字が出ないのは一緒では。特にスマホとかでは

293
デフォルトの名無しさん[sage]   投稿日:2016/07/08 12:53:57  ID:+iCwFkYB.net
Windowsはいい加減にCP932やめればいいのに

294
デフォルトの名無しさん[sage]   投稿日:2016/07/08 13:56:23  ID:SPYn5bNr.net
>290
JIS区点コードな
さすがにいわゆるSJIS系の2バイト文字の話とか
UCS4とかUTF-8とかは通じないだろ

295
デフォルトの名無しさん[sage]   投稿日:2016/07/08 14:04:01  ID:FG8sQouZ.net
>278
歴史的説明ならともかく今時6バイトって

296
デフォルトの名無しさん[]   投稿日:2016/07/08 23:17:05  ID:5kBVrybZ.net
小学生向け漢字辞典にも文字コードが載っているのが唯一ある。三省堂のやつ。
しかしこれがJIS句点コードだけなのだ。こんな所にもJIS信者の陰謀が。
コメント1件

297
デフォルトの名無しさん[sage]   投稿日:2016/07/09 05:34:05  ID:/Jgzrjn9.net
ふむ

298
デフォルトの名無しさん[sage]   投稿日:2016/07/09 16:20:52  ID:ZRZgi1xJ.net
三省堂は安岡センセイの牙城だからな
http://dictionary.sanseido-publ.co.jp/wp/author/yasuoka/

299
デフォルトの名無しさん[sage]   投稿日:2016/07/09 16:24:06  ID:chKLWi+d.net
やっぱり三省堂がナンバーワン!

300
デフォルトの名無しさん[sage]   投稿日:2016/07/09 18:40:43  ID:J471aLuE.net
>296
>句点コード

反省汁
コメント2件

301
デフォルトの名無しさん[sage]   投稿日:2016/07/09 20:53:51  ID:9etHa3qY.net
>300
何をする事がある

302
デフォルトの名無しさん[sage]   投稿日:2016/07/09 23:31:07  ID:XNO4Gui5.net
>300 スマンカッタ
句点と読点のそれぞれのJIS区点コードは……ってそういう話じゃないよね。

今時のオフィスでは漢字をコードで言い表さなくても、メール送って、
この字をコピペしろ、で話が済む。たいていの場合。
だがメールが使えないオフィスが存在するのだ。
ウィルス感染が怖い、個人情報の漏洩が怖い、と言ってごく一部以外のPCは
インターネットに繋がっていない。LANにすら繋がっていない。
穴だらけのXPを全くアップデートせずに使い続けている。

文字コードの知識云々以前にこっちの方が問題かも。

303
デフォルトの名無しさん[sage]   投稿日:2016/07/10 00:58:49  ID:MJNrlAwo.net
十進法で1オリジンだから
十六進法で0オリジンが一般的なプログラミングの世界に持ってく時ちょっと戸惑う>区点コード

304
デフォルトの名無しさん[sage]   投稿日:2016/07/10 01:18:18  ID:D0PozWsA.net
最初から JIS X 0208 で考えていれば違和感は無い。

305
デフォルトの名無しさん[sage]   投稿日:2016/07/10 02:25:10  ID:MUn32aUj.net
𩿎 この字をコピペしろ
で話が済まないこともあるから2面94区5点と書いてある方が親切なこともある
コメント1件

306
名無しさん@そうだ選挙に行こう! Go to vote![sage]   投稿日:2016/07/10 19:18:33  ID:Xe3UNHu3.net(3)
パートのおばちゃんが「この字が出せない」と言っていたので、コードを調べて直接入力の方法を教えた。
そしたら、「そんな難しい方法じゃないと出ない字は出しません」と拒否。
管理職もそれでいいと思っている。

307
名無しさん@そうだ選挙に行こう! Go to vote![sage]   投稿日:2016/07/10 19:28:45  ID:Xe3UNHu3.net(3)
ヒロユキのヒロは康煕字典の煕、ユキは王羲之の之、これで話が通じれは
コードの知識がなくても何とかなる。けどそういう言い方は全く通じない職場がある。
で、バカみたいにA4の紙にでかい字で「煕之」と書いてFAXで送っている。
時間と紙と通信料金の無駄。

308
デフォルトの名無しさん[sage]   投稿日:2016/07/10 20:25:26  ID:Vv5iaDQO.net
>ヒロユキのヒロは康煕字典の煕、ユキは王羲之の之、これで話が通じれは

それで通じる職場ってすごくピンポイントなんじゃないか
コメント1件

309
デフォルトの名無しさん[sage]   投稿日:2016/07/10 23:34:57  ID:Xe3UNHu3.net(3)
>308
字の間違いが決して許されない職場では自然にそうなりそうな気もするんだが。
だいたい職場に大漢和辞典も康煕字典も無いとはもう駄目だ。

鼎という字を「何か県に似ている難しい字」などと言っている。u+9F0Eとは決して言わない。
高校時代に漢文が苦手だった俺だって「鼎の軽重を問う」という故事ぐらい知っている。
高卒以下か。

310
デフォルトの名無しさん[sage]   投稿日:2016/07/11 00:15:55  ID:Oq6wujXh.net
>290
漢ROMには第一水準しか乗ってなかった

311
デフォルトの名無しさん[sage]   投稿日:2016/07/11 00:42:20  ID:TRcfwTqd.net
u+9F0Eとは決して言わない。いや言わんだろw

312
デフォルトの名無しさん[sage]   投稿日:2016/07/11 02:04:05  ID:Y4y2Cs39.net(2)
PC-9801初代とかE、F、Mの頃だな

313
デフォルトの名無しさん[]   投稿日:2016/07/11 02:09:47  ID:Y4y2Cs39.net(2)
いや初代はJIS第1水準ROMも別売オプションだったか

314
デフォルトの名無しさん[sage]   投稿日:2016/07/11 04:11:38  ID:1UixPK66.net
そういう環境は区点でも出ないから今は話題にしてない

315
デフォルトの名無しさん[]   投稿日:2016/07/11 04:53:41  ID:heaUdTdc.net
鼎立(ていりつ)

316
デフォルトの名無しさん[sage]   投稿日:2016/07/11 14:01:39  ID:d9uyyk2v.net

317
デフォルトの名無しさん[sage]   投稿日:2016/07/11 14:48:05  ID:czE7oCdB.net
>  しかし、UTF-8ではUCS-2の範囲の文字しか扱えません。そこで、UCS-2の範囲は2バイト、UCS-4の範囲は4バイト(31ビット)でエンコードする
> サロゲート・ペアと呼ばれる方法が考え出されました。このエンコード法をUTF-16(16-bit UCS Transformation Format)と呼びます。

まるでUTF-8を拡張したらUTF-16が生まれたみたいな書きっぷりなんだが。。。

318
デフォルトの名無しさん[sage]   投稿日:2016/07/11 19:26:42  ID:zdvynnCD.net
dmcがL"\uXXXX"で5桁以上に対応してなかったでござるよ

319
デフォルトの名無しさん[sage]   投稿日:2016/07/11 23:35:12  ID:O+Gjjko5.net

320
デフォルトの名無しさん[sage]   投稿日:2016/07/12 12:50:10  ID:Z7lOs0LB.net
サイト閉鎖させるとか文字コード関係者は傲慢

321
デフォルトの名無しさん[sage]   投稿日:2016/07/12 14:22:38  ID:jKILz9qy.net
そもそも不正確だろうが整合性なかろうが
その旨明記しておけば問題ないのに
断定しちゃうからダメなんだよなぁ
自分用のメモとしても訳に立たんだろうに

322
デフォルトの名無しさん[sage]   投稿日:2016/07/12 16:29:11  ID:/KovKhYj.net(2)
>319
知らないなら解説しないでくださいうざいだけです
コメント1件

323
デフォルトの名無しさん[sage]   投稿日:2016/07/12 16:34:35  ID:/KovKhYj.net(2)
>278
>【Unicodeのエンコーディング】※この章の内容を修正しました(2016年7月8日)

治ってたはω

324
デフォルトの名無しさん[sage]   投稿日:2016/07/12 22:47:59  ID:iIVSUpVx.net
>316のレターの著者=>319のサイトの作者
なの?
Cyber Librarianなら見たことあるけどサイトを見た限りでは
そんな脇の甘いっつーか、ツッコミどころ満載の文章書く人には思えなかったが。

325
デフォルトの名無しさん[sage]   投稿日:2016/07/13 00:43:08  ID:SuD222os.net
https://web.archive.org/web/20160331090356/http://www.asahi-net.or.jp...
まあ同一人物でなければ盗用だろうなってかんじ
コメント4件


326
デフォルトの名無しさん[sage]   投稿日:2016/07/13 01:00:57  ID:elchF/Ne.net
普通に考えたら同一人物だろ
上綱 秀治(かみつな しゅうじ) ⇒ s-kmtn

327
デフォルトの名無しさん[sage]   投稿日:2016/07/13 02:15:04  ID:fhWupBlz.net
くみたんじゃないのか。

328
デフォルトの名無しさん[sage]   投稿日:2016/07/13 04:46:49  ID:QAw5IbxT.net

329
デフォルトの名無しさん[sage]   投稿日:2016/07/13 09:20:59  ID:6cXc/1BZ.net
>325
>UTF-8は、ASCIIコードに当たる部分はASCIIコードと同じコードで
>1バイトで表し、それ以外の文字を2〜6バイトの可変長で表します。
>しかし、UTF-8ではUCS-2の範囲の文字しか扱えません。
>そこで、UCS-2の範囲は2バイト、UCS-4の範囲は4バイトでエンコードする
>サロゲート・ペア(Surrogate Pair)と呼ばれる方法が考え出されました。

自分で書いた嘘を自分で信じ込んでしまったのか

330
デフォルトの名無しさん[sage]   投稿日:2016/07/13 13:48:05  ID:5kGFdS9R.net
>325
あー、これは(アカン)

331
デフォルトの名無しさん[sage]   投稿日:2016/07/13 17:23:44  ID:Zm0ukFfg.net(2)
>322
>319 は解脱したんだ

332
デフォルトの名無しさん[sage]   投稿日:2016/07/13 17:25:59  ID:Zm0ukFfg.net(2)
>325
おわってんな

333
デフォルトの名無しさん[sage]   投稿日:2016/07/13 21:14:40  ID:hX7/yWDM.net
くみたん大人気

334
デフォルトの名無しさん[sage]   投稿日:2016/07/13 23:46:02  ID:g/v1wH4T.net
>305
そうやって親切に説明しても理解しようとしない奴が多い。
自分の努力不足を棚に上げて。
新聞紙屋にも市役所職員にもそういう説明は通じなかった。
コメント1件

335
デフォルトの名無しさん[sage]   投稿日:2016/07/13 23:58:49  ID:r/tNmXJO.net
天皇陛下が生前退位を望んでおられるらしいが
年号が変わったらまた組み文字のがUnicodeに登録されるんだろうか。
そしてNEC特殊文字の空き区点位置にも追加されたりするんだろうか?
コメント2件

336
デフォルトの名無しさん[sage]   投稿日:2016/07/14 14:43:57  ID:QNDyLPqn.net(2)
>334
文系のばかに多いよなそういうの

337
デフォルトの名無しさん[sage]   投稿日:2016/07/14 15:27:07  ID:9OuGPMv3.net
澂鎰遶

338
デフォルトの名無しさん[sage]   投稿日:2016/07/14 17:50:45  ID:/KqsG61x.net
>335
Unicode側が先に動くんじゃなくて国内規格が変わったら重い腰を上げる感じじゃね?

JIS X 0213に追加されたら多分入れざるを得ないだろう。

339
デフォルトの名無しさん[sage]   投稿日:2016/07/14 18:58:13  ID:FxiZTBVJ.net
Unicodeの組み文字はやたら多いんだよなあ
これ以上増やさないでいいと思うが
ARIBあたりは収録しそうだ

340
デフォルトの名無しさん[sage]   投稿日:2016/07/14 19:04:28  ID:QNDyLPqn.net(2)
そもそもどんな元号になるか機械学習で予想汁

341
デフォルトの名無しさん[]   投稿日:2016/07/15 17:59:32  ID:UYk8auDK.net
元号変わったら組み文字がJISやUnicodeに追加されるだろうか。
あれらはあくまで使用非推奨の互換用だけど平成迄あるのに
〇〇(新元号)は無いのはおかしいって文句言う人いそうだし。
そしてUnicodeに追加されるならBMP外になるのかな。

342
デフォルトの名無しさん[sage]   投稿日:2016/07/15 18:35:42  ID:VjVb35Nf.net
JISは確実じゃろう

343
デフォルトの名無しさん[]   投稿日:2016/07/15 19:47:06  ID:hA/ek+uV.net
天皇陛下はさまざまな影響を考えて、数年後とおっしゃっている。

344
デフォルトの名無しさん[sage]   投稿日:2016/07/15 21:22:13  ID:6VjYEGCM.net
天皇陛下はさまざまな影響を考えて、(Unicodeへの追加は)数年後とおっしゃっている。

かと思った
コメント1件

345
デフォルトの名無しさん[sage]   投稿日:2016/07/15 23:56:20  ID:sNlxveIP.net
明治〜平成がBMPなのに新元号がSMPなのは納得いかないって人出てくるだろう。
でもU+33xxのBMPのCJK互換文字領域は空いてない。
U+32xxの囲み文字等の領域だったら
U+32FFが空いてるけどそこは○ンの為にとっておくべきって理由で却下かも。
(ARIB外字の□デは当初そこで提案されてたがSMPに移された。)
U+321Fも空いてるけどそこはハングルの為に予約でダメかな。
2文字合わせて1字の漢字扱いでCJK統合漢字無印の末端部分に追加とかするかも。
コメント1件

346
デフォルトの名無しさん[]   投稿日:2016/07/16 00:01:26  ID:5z5Xjrfb.net
>344
陛下はIT業界のことまで考えてくださっているんだぞ。

347
デフォルトの名無しさん[sage]   投稿日:2016/07/16 00:14:15  ID:32MvK4yp.net
>345
>2文字合わせて1字の漢字扱い

面白いけど縦書きしたときに組み変わる漢字ってありなのかなあ…

348
デフォルトの名無しさん[sage]   投稿日:2016/07/16 00:24:24  ID:gxGUgS9b.net
明治を廃止して新元号をそこに追加
コメント1件

349
デフォルトの名無しさん[sage]   投稿日:2016/07/16 01:19:59  ID:cSN7L73p.net
ケチ臭いこと言わず大化から全部実現できるよう結合文字でやれ
コメント1件

350
デフォルトの名無しさん[]   投稿日:2016/07/16 02:08:19  ID:nOt6AvP3.net
>348
それはない

351
デフォルトの名無しさん[sage]   投稿日:2016/07/16 02:30:42  ID:lwkaPYM/.net(2)
書類上は明治生まれもまだいっぱい生き残って年金もらってるんだろう?

352
デフォルトの名無しさん[sage]   投稿日:2016/07/16 06:16:44  ID:G3ZPSnBi.net
明治生まれって105歳くらいでそろそろ長寿ギネスを争う位置やで
ゴーストは知らんけど例の事件以降対策は取ってるはず

353
デフォルトの名無しさん[]   投稿日:2016/07/16 14:40:44  ID:9Y22Kipm.net(2)
>335
生前退位は間違い
正しくは譲位
コメント1件

354
デフォルトの名無しさん[]   投稿日:2016/07/16 14:43:32  ID:9Y22Kipm.net(2)
>349
それな+1

355
デフォルトの名無しさん[]   投稿日:2016/07/16 17:16:57  ID:q/+YlM5I.net
>353
譲位もいまの日本の法律では規定されていない言葉。

356
デフォルトの名無しさん[sage]   投稿日:2016/07/16 20:48:48  ID:lwkaPYM/.net(2)
譲位だと本人の意思が入るから、憲法との関係上無理だろうな。

357
デフォルトの名無しさん[sage]   投稿日:2016/07/16 22:09:26  ID:ngMcbYeI.net
間を取って、新元号を「譲位」にするのだ。

358
デフォルトの名無しさん[sage]   投稿日:2016/07/16 23:20:32  ID:DxYW1o4r.net
Macの機種依存文字でUnicodeにない組み文字とかは
PUAのうち何個かのコードポイントを後続の複数文字を組み文字とみなすとかの制御文字にして
変換時はそれらを使ったシーケンスにしてるけど
それらを正式なUnicodeポイントに追加すればいいんじゃないかな。
BMPの末端部の特殊用途文字の領域空いてるよな。多くなったら14面使えばいいし。

359
デフォルトの名無しさん[sage]   投稿日:2016/07/17 07:52:07  ID:x5VmunYw.net
ゼロレングス結合何とかでいいだろ
年号

360
デフォルトの名無しさん[sage]   投稿日:2016/07/17 11:40:00  ID:4VxhtWVI.net
[組文字2字] ○ × みたいな組み合わせで組文字を出せれば、どんな元号だろうと対処できるんじゃね?

361
デフォルトの名無しさん[sage]   投稿日:2016/07/17 12:03:06  ID:OJhNugRE.net
立ちふさがる神護景雲

362
デフォルトの名無しさん[sage]   投稿日:2016/07/17 19:57:53  ID:SZ0VR+WQ.net
絵文字だと4人くっつけて家族にしてるから余裕だろ

363
デフォルトの名無しさん[sage]   投稿日:2016/07/18 13:08:10  ID:DeXLreOM.net
天平hogehogeも忘れないであげて

364
デフォルトの名無しさん[sage]   投稿日:2016/07/18 14:35:50  ID:xsPahNIS.net
Unicode Consortium、人物を示す絵文字の大半で男女の切り替えを可能にする計画
http://it.srad.jp/story/16/07/17/1824252/

365
デフォルトの名無しさん[sage]   投稿日:2016/07/18 18:20:37  ID:Al5nS1HD.net
いらん

366
デフォルトの名無しさん[sage]   投稿日:2016/07/18 20:01:39  ID:V8MPLMCF.net
男のプリンセス👸みたいな

367
デフォルトの名無しさん[sage]   投稿日:2016/07/18 20:49:35  ID:nMdxdQ2m.net
結局タグ文字は止めてZWJでくっつけることにしたのか
まあ俺は要らんけど、Googleはやるんだろうな。

368
デフォルトの名無しさん[sage]   投稿日:2016/07/19 01:10:44  ID:OzJr/LCv.net
うんこと炎をくっつけて焼きカレー

369
デフォルトの名無しさん[sage]   投稿日:2016/07/20 00:14:41  ID:c9Lgaa22.net
俺なんでこんなの書いたんだろ

370
デフォルトの名無しさん[sage]   投稿日:2016/07/20 16:25:57  ID:uqKREUqt.net
元号の組み文字も平成の次からは
(1文字目) ZWJ (2文字目)
でいいだろう。元号に限らず他の組み文字もこのようなやり方で。

371
デフォルトの名無しさん[sage]   投稿日:2016/07/21 22:48:02  ID:9yJr9MXg.net
L2/16-188 Revised Proposal of Hentaigana (with associated spreadsheet) Japan N.B. 2016-07-15
http://www.unicode.org/L2/L2016/16188-rev-hentaigana-rep.pdf
L2/16-189 Proposal to add a new character name alias to U+1B001 Japan N.B. 2016-07-15
http://www.unicode.org/L2/L2016/16189-n4731-alias-to-1B001.pdf

久しぶりに日本の提案書が来てた。

372
デフォルトの名無しさん[sage]   投稿日:2016/07/22 00:45:15  ID:9PI3Dwz3.net
HENTAIYAGANA!

同じ音価のやつどう名前つけるのかと思ってたら単純に番号振ったんか。
しっかしほぼ同じじゃないかってやつがいくつもあるな…

373
デフォルトの名無しさん[sage]   投稿日:2016/07/22 15:36:11  ID:mXdhJl5k.net
http://www.unicode.org/L2/L2016/16189-n4731-alias-to-1B001.pdf
>※ HENTAIGANA LETTER E-1


当然のように「※」を使っちゃうあたり紛れもなくわが国のNBだな

374
デフォルトの名無しさん[sage]   投稿日:2016/07/22 18:46:03  ID:30Ur4lVX.net
海外でHENTAIって言ったらエロ漫画のことなんだろ?

375
デフォルトの名無しさん[sage]   投稿日:2016/07/22 23:40:37  ID:ftmyXYU2.net
変態がな(´・ω・`)

376
デフォルトの名無しさん[sage]   投稿日:2016/07/23 19:23:17  ID:23ptH+Cg.net
HENTAIGANAじゃなくてARCHAIC KANAにした方がいいかな。

377
デフォルトの名無しさん[sage]   投稿日:2016/07/23 22:48:56  ID:9DZF6Yvk.net
376ができるならそうしてほしい

378
237[sage]   投稿日:2016/07/24 13:36:56  ID:6r1nbUWl.net
Wikipediaにも別称として載ってるitaiganaならまだしも、一般的でない訳語を増やすのはやめてくれ

379
デフォルトの名無しさん[]   投稿日:2016/07/24 13:38:46  ID:wdZTIji9.net
しらんがなも追加で

380
デフォルトの名無しさん[]   投稿日:2016/07/24 14:21:52  ID:KetOMPlM.net
痛い(>_<)がな

381
デフォルトの名無しさん[sage]   投稿日:2016/07/24 18:14:24  ID:jDvbVIvk.net
しらんがな-1
しらんがな-2
しらんがな-3

どうでもいいレベルに応じて数字が上がっていくしらんがな

382
デフォルトの名無しさん[sage]   投稿日:2016/07/25 03:34:48  ID:+HnBvISv.net
しらんがな(´・ω・`)

383
デフォルトの名無しさん[sage]   投稿日:2016/07/27 23:58:18  ID:LlxcxPCX.net
漢字なんかもUnicodeではCJK Ideograph(日中韓の表意文字)という独特な表現なんだよな。
通常はChinese character(中国の文字)とか日本で使われるもの限定ならKanjiとかだけど、
中国語だけでなく日本語でも必要不可欠なことから中立的な観点でそうしたのかな。
コメント2件

384
デフォルトの名無しさん[]   投稿日:2016/07/28 00:49:49  ID:5nmTx3N/.net
>383
それUTF-16だろ。

385
デフォルトの名無しさん[sage]   投稿日:2016/07/28 01:46:29  ID:0eJShhc0.net
ぇ?

386
デフォルトの名無しさん[sage]   投稿日:2016/07/28 03:14:54  ID:V4Cbn7HZ.net(2)
え?

387
デフォルトの名無しさん[sage]   投稿日:2016/07/28 06:15:57  ID:A01hQQOB.net
ゑ?

388
デフォルトの名無しさん[sage]   投稿日:2016/07/28 07:33:28  ID:Gt2rQ6iY.net
>383
「漢字って言語圏ごとに登録したらとんでもない量になる。出自は同じだし統合すっか」
っていう混ぜ書き全否定な仕様にしたからな
統合したんだからKanjiっていう日本語読みじゃなくて「極東の表意文字」みたいな名前つけられるのは当然の成り行き
コメント1件

389
デフォルトの名無しさん[sage]   投稿日:2016/07/28 08:14:34  ID:tnN3Zull.net
UCDのファイル名はUnihan(Unified-HAN)だろ
つまり韓国が起源

390
デフォルトの名無しさん[sage]   投稿日:2016/07/28 09:47:39  ID:V0F605Q9.net
繁字体の繁

391
デフォルトの名無しさん[sage]   投稿日:2016/07/28 10:28:08  ID:49cPLP5e.net
そうはいっても迷惑かけている部分もあるからな
英語だったら高々数十個のアルファベットと幾つかの記号だけで済むところを
何万種類も必要になる方が悪いだろ、どう考えても

392
デフォルトの名無しさん[sage]   投稿日:2016/07/28 10:52:38  ID:765MMEfE.net
>どう考えても
何をどう考えたらそんなキチガイの発想に至ったのか

393
デフォルトの名無しさん[sage]   投稿日:2016/07/28 13:16:07  ID:V4Cbn7HZ.net(2)
英国はアヘン戦争で清を滅亡させるべきだったし、
米国は太平洋戦争で日本を滅亡させるべきだったね。

394
デフォルトの名無しさん[sage]   投稿日:2016/07/28 13:20:15  ID:xeepOtn0.net
幽霊文字が規格化される国だから反論できない
コメント1件

395
デフォルトの名無しさん[sage]   投稿日:2016/07/28 14:16:22  ID:ZhRv9dtO.net
勝手に新しい絵文字作り出してる現状なんだし気にするな
と思ったけど文字が少ない文化圏の連中はその反動なのかもしれないな

396
デフォルトの名無しさん[sage]   投稿日:2016/07/28 19:12:45  ID:O8Vfrh0P.net
将来再び毛沢東みたいなアホが出てきて新文字増やす可能性もないとはいえない

397
デフォルトの名無しさん[]   投稿日:2016/07/28 23:10:34  ID:+NfDBjt/.net
>388
でも統合しきれなくてコードポイントを無駄遣いしているのが多数。
例えば一例として説と說が別字扱いというのは納得できない。
康煕字典に47000字、大漢和辞典に50000字というのは調べれば最初から分かった筈。
相当節約すべきなのにそれを怠ったから16bitのバベルの塔は頓挫した。

>394
そしてそれを廃止できない。負の文化遺産として今後も残るだろう。
コメント1件

398
デフォルトの名無しさん[sage]   投稿日:2016/07/28 23:49:12  ID:m+0rYuPE.net
そういえばニホニウムの中国語表記はどうなるんだろう
コメント1件

399
デフォルトの名無しさん[sage]   投稿日:2016/07/29 01:02:54  ID:SETcyGJa.net
小日本素あたり?

400
デフォルトの名無しさん[sage]   投稿日:2016/07/29 07:36:19  ID:Lct7OLsq.net
え?

401
デフォルトの名無しさん[sage]   投稿日:2016/07/29 08:13:31  ID:GYJuIIBJ.net
>397
>説と說が別字扱いというのは納得できない
自国の文化以外を受け入れることが出来ない奴は吠えてろ。
アメリカ人が英語圏以外のことを軽視してるのと同様に
お前のその思想が世界に迷惑
コメント1件

402
デフォルトの名無しさん[sage]   投稿日:2016/07/29 12:00:07  ID:5X3dVFw4.net
原規格分離規則が無かったら更にカオスなことになってそう

403
デフォルトの名無しさん[]   投稿日:2016/07/29 23:13:14  ID:qPs+aDEn.net
>401
それは逆。
漢字文化を理解しない西洋人が規格化したからそうなってしまった。
康煕字典の「正字」がどのような経緯で成立したかほんの少し勉強すれば、それらが同字だと理解できる。
ついでに日本のバカな国語審議会がどんなふうにバカな国語国字改革を行ったかも知っておくべき。
コメント1件

404
デフォルトの名無しさん[sage]   投稿日:2016/07/30 00:36:36  ID:GBcwIM/b.net
説と說の違いなどフォントの違いに過ぎない。
これを別字だと主張するのはGaramondのAとBodoniのAは別字だと主張する様なものだ。
コメント1件

405
デフォルトの名無しさん[sage]   投稿日:2016/07/30 01:00:50  ID:nwxv/kKT.net
IPAを食らうがよい

406
デフォルトの名無しさん[sage]   投稿日:2016/07/30 02:27:38  ID:VkFDbK5O.net
フォントの違い?じゃあ別字で😁
A A 𐌀 𝐀 𝐴 𝑨 𝒜 𝓐 𝔄 𝔸 𝕬 𝖠 𝗔 𝘈 𝘼 𝙰
コメント1件


407
デフォルトの名無しさん[sage]   投稿日:2016/07/30 03:37:32  ID:crIAC8Sk.net
BOMを食らうが良い。

408
デフォルトの名無しさん[sage]   投稿日:2016/07/30 05:58:51  ID:7lrNNE5f.net
>403を通訳すると
「現規格分離などどうでもいい」
「日本の漢字文化がすべて。他の国のことは知らん」
最悪だな

409
デフォルトの名無しさん[sage]   投稿日:2016/07/30 06:32:16  ID:RG1Ilx1/.net
× 現規格
○ 原規格

410
デフォルトの名無しさん[]   投稿日:2016/07/30 13:16:26  ID:NnN7Vre0.net(2)
>404
華と华は同じ字ですか?

411
デフォルトの名無しさん[]   投稿日:2016/07/30 13:17:35  ID:NnN7Vre0.net(2)
>406
Уとyは同じ字ですか?

412
デフォルトの名無しさん[]   投稿日:2016/07/30 21:48:28  ID:dIHoRAg/.net






カタカナのヘ
ひらがなのへ

413
デフォルトの名無しさん[]   投稿日:2016/07/30 21:55:31  ID:cBq8SpsU.net
:::::::::::/           ヽ::::::::::::
:::::::::::|  ば  じ  き  i::::::::::::
:::::::::::.ゝ か   つ   み  ノ:::::::::::
:::::::::::/  だ  に  は イ:::::::::::::
:::::  |  な。       ゙i  ::::::
   \_         ,,-'
――--、..,ヽ__  _,,-''
:::::::,-‐、,‐、ヽ. )ノ      _,,...-
:::::_|/ 。|。ヽ|-i、      ∠_:::::::::
/. ` ' ● ' ニ 、     ,-、ヽ|:::::::::
ニ __l___ノ     |・ | |, -、::
/ ̄ _  | i     ゚r ー'  6 |::
|( ̄`'  )/ / ,..    i     '-
`ー---―' / '(__ )   ヽ 、     >1
====( i)==::::/      ,/ニニニ
:/     ヽ:::i       /;;;;;;;;;;;;;;;;

414
デフォルトの名無しさん[sage]   投稿日:2016/08/01 17:17:15  ID:JXVULl1x.net
ソとンは微妙なのは判るが
ツとシは明らかに違う字だろ
コメント1件

415
デフォルトの名無しさん[sage]   投稿日:2016/08/01 17:43:19  ID:A0XjWkqP.net
( ツ )ノシ

416
デフォルトの名無しさん[sage]   投稿日:2016/08/01 22:12:49  ID:AzMK4PQ3.net(3)
兌を部品として含む字は説の他にも色々ある。
脱 税 悦 など。これらは統合されている。
説は何故か康煕字典の正字(Big5,KS)と楷書通用字体(JIS,GB)の2種類に分裂している。
固有名詞の表記で揉め事になる字でもない。何かの手違いかと。

>414
日本人にとっては明らかに違う字だが中国人、韓国人などには区別しづらいようだ。
アジアからの輸入品ではそういう誤植はよく見かける。ショートカット→ツョートカシト など。
レ、し の混同も多い。
コメント1件

417
デフォルトの名無しさん[sage]   投稿日:2016/08/01 22:24:15  ID:AzMK4PQ3.net(3)
日本人にとってシンデレラとツンデレラは明らかに違う。外国人に(ry

418
デフォルトの名無しさん[sage]   投稿日:2016/08/01 23:10:29  ID:AzMK4PQ3.net(3)
説と说はunicodeでは別字だった。
という事で訂正。JISは楷書通用字体、GBは簡体字。つまり3種類に分裂している。
スマンカッタ。
コメント1件

419
デフォルトの名無しさん[sage]   投稿日:2016/08/02 02:07:22  ID:1KCZrKLH.net
>418を通訳すると
「原規格分離などどうでもいい」

Windowsコードページ936(GBK)より
U+8AAC(説) = D568
U+8AAA(說) = D566
U+8BF4(说) = CBB5
コメント1件

420
デフォルトの名無しさん[sage]   投稿日:2016/08/02 14:41:15  ID:X69kNOq3.net

421
デフォルトの名無しさん[sage]   投稿日:2016/08/02 19:31:05  ID:JwtZ9iAm.net
>416
>ショートカット→ツョートカシト

日本人にもいるわ

422
デフォルトの名無しさん[sage]   投稿日:2016/08/02 20:49:40  ID:LBy6cWLg.net
こうやって、タンクトップにショートパンツを貼り付けるんだお。
意味:デスクトップにショートカットを貼り付ける。

423
デフォルトの名無しさん[sage]   投稿日:2016/08/02 23:35:51  ID:zi+BVpwh.net
ディスクトップのことをタンクトップというやつは見たことないな

424
デフォルトの名無しさん[sage]   投稿日:2016/08/02 23:48:20  ID:2l83Zpm1.net
円盤の上に

425
デフォルトの名無しさん[sage]   投稿日:2016/08/03 00:17:44  ID:4zWXrFMO.net(2)
>398-399
中国人は元素記号を漢字1文字で表す。こんな具合。
http://www.akatsukinishisu.net/kanji/genso/UTF-8.html

>419
GBKはUnicode1.1より後に出来た。何故かUnicodeの駄目な部分をかなり含んでいる。
それを引き合いに出すのは筋違いとまでは言わなくても、慎重に考える方が良いかと。

426
デフォルトの名無しさん[sage]   投稿日:2016/08/03 17:17:04  ID:XuAWxec+.net
iOS 10では拳銃の絵文字が水鉄砲の絵文字に置き換えられる | スラド アップル
http://apple.srad.jp/story/16/08/03/0444222/

427
デフォルトの名無しさん[sage]   投稿日:2016/08/03 18:29:34  ID:mbys/AN5.net(2)
わろた

428
デフォルトの名無しさん[sage]   投稿日:2016/08/03 18:31:08  ID:mbys/AN5.net(2)
Aが牛刀かなんかで
JがJナイフだろ

429
デフォルトの名無しさん[sage]   投稿日:2016/08/03 23:47:05  ID:4zWXrFMO.net(2)
森鴎外と書こうと森鷗外と書こうとどちらでも良い、というのが一般人の感覚。
これはそれほど不健全とは思えない。何しろ自筆原稿に「森鴎外」と書かれているんだから。
鴎は俗字だケシカラン、というのは一部の規範意識の強い正字正かな主義のキチガイ。
鷗はダメだ鴎と書け、というのはもっと訳のわからん国語改革主義のキチガイ。
こいつらがJISの83改定を行った為にカオスに。
コメント1件

430
デフォルトの名無しさん[]   投稿日:2016/08/04 08:56:22  ID:FjB5rL2o.net
>429
使いわけがされていない字体違いの漢字はまとめてしまおうというのは文字コードの問題ではない。
コメント1件

431
デフォルトの名無しさん[sage]   投稿日:2016/08/04 12:12:59  ID:8anV95gh.net(2)
恵'
っていうのも流行ったけど
文字コードありますか?

432
デフォルトの名無しさん[sage]   投稿日:2016/08/04 17:09:02  ID:TBSxpqkz.net
U+6075 U+E101

433
デフォルトの名無しさん[sage]   投稿日:2016/08/04 18:54:49  ID:GAy76/a3.net
U+FA6B
U+6075 U+E103

でもいいのよ?

434
デフォルトの名無しさん[sage]   投稿日:2016/08/04 19:07:39  ID:8anV95gh.net(2)
U+FA6B でいけましたありがとう

435
デフォルトの名無しさん[sage]   投稿日:2016/08/04 19:32:46  ID:Ki4RLkNz.net
U+6075 U+FE00
でもいいぞ

436
デフォルトの名無しさん[sage]   投稿日:2016/08/05 14:48:07  ID:nIRHSvG0.net
この流れ、前にどこかで読んだ気がするなー、と思ったら
直井氏の「重複符号化四天王」だった。↓

http://d.hatena.ne.jp/NAOI/20130116/1358319668
コメント1件

437
デフォルトの名無しさん[sage]   投稿日:2016/08/05 14:56:27  ID:9LvdmO9z.net
ということは祇園もあれか
祗園と書くとやられるのか
コメント2件

438
デフォルトの名無しさん[sage]   投稿日:2016/08/05 14:58:22  ID:LJe/qM3f.net
julia> '\ufa6b'
'恵'

さすがだな

439
デフォルトの名無しさん[sage]   投稿日:2016/08/05 22:00:51  ID:49rJvUnO.net
>436
最近更新されてないな
コメント1件

440
デフォルトの名無しさん[sage]   投稿日:2016/08/05 22:19:20  ID:zXAznUbh.net
>430
いや、全く無関係ではあるまい。
鴎と鷗は使い分けがされていなかった、という点ではあなたも同意してくれるだろう。
原規格分離されていないのにUnicodeでは別字扱いになってしまった。
そもそも83改定を行ったJISと唆した国語審議会に元凶があったのだが、Unicodeにも責任の一端がある。
国語審議会は鷗を滅ぼして鴎に置き換えようとした。
本人に問い詰めて確認したわけではないが、多分そういう事だろう。
1000年以上にわたって使われ続けた字を滅ぼす事などそう簡単に出来る筈がない。
結局、国語審議会に滅ぼされる事なく生き残り、鴎と別の字になってしまった。

なお、最近見たベネッセの小学漢字辞典に鷗は載っていたが鴎は載っていなかった。

>437
祇と祗は元々意味も読みも異なる別字。だが見た目が良く似ているので古くから混同される事が多かった。
「ぎおん」と入力して「祗園」と変換出来てしまうMS-IMEが悪い。
百歩譲ってその変換を認めるとしても、せめて「本来は誤用」ぐらいのメッセージは出してほしい。

441
デフォルトの名無しさん[sage]   投稿日:2016/08/05 23:24:48  ID:Ox1rQ2Fh.net
>437
フォントその他がJIS X 0213:2004対応かどうかで
偏が「示」になったり「ネ」だったりには変わるな

442
デフォルトの名無しさん[sage]   投稿日:2016/08/06 05:56:41  ID:g/BBNoMH.net
もう数字の「1」も漢数字の「一」と統合しろよ。
「一回」と「1回」みたいに使い分けされてないだろ。
「ひとつ を 1つ と書くのはけしからん」なんて言う奴はキチガイ。
コメント1件

443
デフォルトの名無しさん[]   投稿日:2016/08/06 06:01:39  ID:e+VUV2JF.net(2)
使う漢字を減らそうとして常用漢字を策定しているのにそれが気に入らないなら義務教育を否定しろよ。

444
デフォルトの名無しさん[sage]   投稿日:2016/08/06 06:15:36  ID:zLWUK7Cp.net
>442
1朝1夕 とか 1石2鳥 とか 8百万(やおよろず) なんて書かれたら脱力ものだけど
今じゃこんなのは当たり前なんだろうか
コメント1件

445
デフォルトの名無しさん[sage]   投稿日:2016/08/06 06:22:28  ID:swGxqhgp.net
つまり加藤1239段と書けと
コメント1件

446
デフォルトの名無しさん[sage]   投稿日:2016/08/06 09:57:23  ID:G90m6v3V.net
>444
見たことはないが、読みがわからん奴がそのうちやるだろう。

447
デフォルトの名無しさん[sage]   投稿日:2016/08/06 15:41:55  ID:lXyGJ+4s.net
4国地方
9州地方
コメント1件

448
デフォルトの名無しさん[]   投稿日:2016/08/06 22:32:19  ID:E3d0sLCL.net(2)
16進数

449
デフォルトの名無しさん[]   投稿日:2016/08/06 22:35:24  ID:E3d0sLCL.net(2)
>447
4は、ヨン、シ
よみかたがどうなるのか

時代と共によみかたもかわるそうだが、だからといって、よみかたは、どうでもいいとはいえない
辞書順にならべかえた場合、探しにくい

しじゅうきょく
しじゅうきょくもーめんと
四極子(しきょくし、英: quadrupole, quadrapole)または四重極とは、モーメントが等しい双極子
Wikipedia

450
デフォルトの名無しさん[]   投稿日:2016/08/06 23:28:50  ID:e+VUV2JF.net(2)
8日をはちにち、17日をじゅうななにちと口頭で言うなって感じだな。

特に8日と4日は聞き間違う可能性は低い。

451
デフォルトの名無しさん[sage]   投稿日:2016/08/07 13:43:44  ID:sg2m+nAp.net
もうかなり前から小学校教育では
14日はじゅうよんにちだな
コメント2件

452
デフォルトの名無しさん[]   投稿日:2016/08/07 15:24:00  ID:62bJhx0K.net
>451
本当?

453
デフォルトの名無しさん[sage]   投稿日:2016/08/07 16:16:16  ID:9cSo/AxT.net
三重県よんにちいち市

454
デフォルトの名無しさん[]   投稿日:2016/08/07 17:19:20  ID:49wBLG90.net
>451
教員が間違っていることはよくあるんだよな。

俺も子供のころ、いろんな担任が漢字の読みを間違っていたし。

455
デフォルトの名無しさん[sage]   投稿日:2016/08/07 23:09:39  ID:W0a9UwyT.net
>445
そんなのは異体字セレクターか何かで何とかしろ

456
デフォルトの名無しさん[sage]   投稿日:2016/08/07 23:58:49  ID:13NE3PeU.net
絵文字のピストル、本物っぽいデザインとおもちゃっぽいデザインのどっちがいい? | スラド IT http://it.srad.jp/story/16/08/06/2215228/

457
デフォルトの名無しさん[sage]   投稿日:2016/08/08 00:42:12  ID:h/269Flb.net
4様

458
デフォルトの名無しさん[sage]   投稿日:2016/08/17 16:58:01  ID:DacIS0G0.net(2)
秀丸エディタで補助漢字入りEUC-JPのデータをいじってたら何か化ける
というか秀丸がいうEUCって普通のEUC-JPじゃなくてコードページ51932(+ JIS X 0212)なのか?
コメント1件

459
デフォルトの名無しさん[sage]   投稿日:2016/08/17 18:00:48  ID:KP9VFMD+.net
ではまずお前の思っている「普通のEUC-JP」「51932」の定義を言ってみろ

460
デフォルトの名無しさん[sage]   投稿日:2016/08/17 18:48:59  ID:DacIS0G0.net(2)
コードページ51932は正直よく知らないんで何ともだが
「普通のEUC-JP」はGLにASCII、GRにJIS X 0208を最初からロッキングシフトしておいて
JIS X 0212を使いたい時はSS3で一文字づつ呼び出すやつ、という説明でいいのか?
コメント1件

461
デフォルトの名無しさん[sage]   投稿日:2016/08/17 19:48:09  ID:rsNvN518.net(2)
まじかよ最悪だな禿丸
でも試しに8F B2 D1を読み込ませたらX 0212の18-49が表示されたぞ
よくわからん
コメント1件

462
デフォルトの名無しさん[sage]   投稿日:2016/08/17 21:43:57  ID:q9L8GmQf.net
CP51932の文字セットは932そのままじゃなかったかな?丸数字とか入ってる筈。補助漢字無し
unicode?51932の変換する時中で一旦932にするので注意だったような
コメント1件

463
デフォルトの名無しさん[sage]   投稿日:2016/08/17 23:42:13  ID:rsNvN518.net(2)
Windows-31JとJIS X 0212に有ってShift_JISに無い文字(例:U+9A4E)を含むUTF-32ファイルを開いてEUC-JPで保存する時だな。
UTF-32(U+9A4E)→シフトJIS IBM拡張文字(FB FB)→シフトJIS NEC選定IBM拡張文字(EE DF)→JIS(7C 61)→CP51932(FC E1)
という経路で変換するんだろうな。
>458が期待したのは
UTF-32(U+9A4E)→(69 51)→EUC-JP(8F E9 D1)
だったと。
JIS X 0212はよく知らんが、UTF-32とのマッピング表がobsoleteなんだから禿丸の動作は仕方なくね
コメント1件

464
デフォルトの名無しさん[]   投稿日:2016/08/17 23:54:23  ID:9FJ+LbN2.net(2)
>461
ほとんどは正常?なんだけど、
NEC特殊文字/NEC選定IBM拡張文字/IBM拡張文字に入ってる(中でその後JIS X 0212に採録された)280文字はコードページ932の区点が優先されるっぽい?

""はJIS X 0212に従うEUC-JPなら02区81点 8F A2 F1になるはずだが秀丸のEUCでは13区66点 AD E2になってる、
"鸙"は76区54点 8F EC D6になるはずだが秀丸のEUCでは92区77点 FC EDになってる。

>462
文字集合を932と同じに拡張したEUC表現ってことでいいのかですかね、ありがとう。

465
デフォルトの名無しさん[sage]   投稿日:2016/08/17 23:58:51  ID:9FJ+LbN2.net(2)
>463
そうそう、そういうことです!
補助漢字の前にコードページ932のNEC特殊文字/IBM拡張文字が優先なんですね……。
まあ最初からUTF-8かUTF-16にすればいいんだけど、うーん

長々とすみませんでした。

466
デフォルトの名無しさん[sage]   投稿日:2016/08/19 02:34:45  ID:na9GQU+3.net
つーかWindowsで動くエディタで、CP932互換じゃないEUC-JPに変換するのあるの?
コメント1件

467
デフォルトの名無しさん[sage]   投稿日:2016/08/19 08:11:13  ID:R+gedXV1.net
932互換でも構わんがJISX0212使っといて一部はG1(X0208)とか頭おかしいだろ
シングルシフト3は無しにして別に「EUC(0212有)」みたいな文字コードを設けろって感じ

468
デフォルトの名無しさん[sage]   投稿日:2016/08/19 13:01:11  ID:cXkrYKyS.net
文字コードは難しすぎますね
すべての文字列はUTF-32で統一されるべきでしたわ
コメント1件

469
デフォルトの名無しさん[]   投稿日:2016/08/19 16:44:17  ID:MDjzAPUc.net
>466
「〜」でやられることは割とまじで良くあるな

470
デフォルトの名無しさん[sage]   投稿日:2016/08/21 00:40:20  ID:8CSn2PR2.net
>460の言う普通のEUC-JPって
「~」を保存するとX0212になるんけ?
シフトジスの円マークを超える爆弾やないか

471
デフォルトの名無しさん[sage]   投稿日:2016/08/21 01:09:58  ID:y7QDjexr.net
0212のTILDEはU+FF5Eにすればいいのでは

472
デフォルトの名無しさん[sage]   投稿日:2016/08/22 17:49:33  ID:Rx9mnEUz.net
根拠のない俺マッピングですか

473
デフォルトの名無しさん[sage]   投稿日:2016/08/22 19:04:01  ID:1uqoHG7Z.net
>439
Twitter に鞍替えしちゃったからなあ

474
デフォルトの名無しさん[sage]   投稿日:2016/08/24 18:34:55  ID:LiadQQJo.net
>468
UTF-32を勉強したけど、結合シーケンスの
正規化のあたりで難しくてついていけなくなった

475
デフォルトの名無しさん[sage]   投稿日:2016/08/31 19:23:24  ID:ydwY4yt1.net
そう言えば昔、Unicodeのインディアンスレ?があったけど
スレは単発で終わったんだっけ
コメント1件

476
デフォルトの名無しさん[sage]   投稿日:2016/08/31 20:38:55  ID:gNQCVbH8.net(2)
>475
&#x1F473;&#x2754;
コメント1件

477
デフォルトの名無しさん[sage]   投稿日:2016/08/31 20:39:42  ID:gNQCVbH8.net(2)
(´・ω・`)

478
デフォルトの名無しさん[sage]   投稿日:2016/08/31 21:34:59  ID:oHNJUglq.net
>476
👳❔

479
デフォルトの名無しさん[sage]   投稿日:2016/08/31 22:07:21  ID:eDoof1t5.net
インディアンの顔文字提案スレですね

480
デフォルトの名無しさん[sage]   投稿日:2016/08/31 23:58:22  ID:3OVWpwKX.net
10人のインディアンが一人づついなくなるのか

481
デフォルトの名無しさん[sage]   投稿日:2016/09/01 01:10:12  ID:lZ/6Z4Ol.net
箸ZWJで結合するのかな

482
デフォルトの名無しさん[sage]   投稿日:2016/09/02 18:21:16  ID:aYJKGs1c.net
Unicodeオワットル

483
デフォルトの名無しさん[sage]   投稿日:2016/09/02 23:20:06  ID:24FH2nuP.net
NFKD正規化って存在価値あるの?
オ疋襪鬟ワットルに変換できた所で
何がうれしいのかよくわからん
コメント1件

484
デフォルトの名無しさん[sage]   投稿日:2016/09/03 00:41:07  ID:2+PqWpLf.net
NFKDを検索したら𝐍𝐅𝐊𝐃も𝑁𝐹𝐾𝐷もマッチする方が嬉しいし
1月が㋀にマッチしたり株式会社が㍿にマッチしたら嬉しいから
俺はメリットがあると思うけど

485
デフォルトの名無しさん[sage]   投稿日:2016/09/03 02:21:27  ID:0X4SIQFT.net
半角ABCで検索したら全角ABCがヒットしないFirefoxさん…

486
デフォルトの名無しさん[sage]   投稿日:2016/09/04 17:57:17  ID:t4IVeB0G.net
>483
分解除外採用すべきやろな
仕様がクソすぎる

487
デフォルトの名無しさん[sage]   投稿日:2016/09/04 22:08:48  ID:I3Tx/JDs.net
その割に何十個もあるハイフン系は
NFKDでもまとまらないという
コメント1件

488
デフォルトの名無しさん[sage]   投稿日:2016/09/05 08:48:36  ID:uKd9K+Pl.net
>487
それはNFKDの仕事じゃない
コメント1件

489
デフォルトの名無しさん[sage]   投稿日:2016/09/06 20:51:36  ID:xwAMZRD2.net
>488
似た文字を正規化すんのがKの正規化でしょ
実際にU+2011はNFKDでU+2010になるし
コメント1件

490
デフォルトの名無しさん[sage]   投稿日:2016/09/06 21:18:50  ID:zD4Ev6Rw.net
そろそろポケモン来る?

491
デフォルトの名無しさん[sage]   投稿日:2016/09/07 01:48:06  ID:ebFGMU7R.net
もう横棒類は全部 HYPHEN-MINUS に置き換えしとけ

492
デフォルトの名無しさん[sage]   投稿日:2016/09/07 03:48:29  ID:lO0k6I5n.net
>489
compatibilityがあるものだけ
何十個もcompatibilityのあるdash/hyphenはない
横棒っぽい文字を全部集めたら数十種類あると思うが
それを全部例えばhyphen-minusに変換したら
テキストの意味が変わってしまい
到底NORMALizationと呼べるようなものではない
勿論そういう変換が有効な応用ではそうしていい

493
デフォルトの名無しさん[sage]   投稿日:2016/09/08 20:41:13  ID:vRujICD+.net
つまり「俺のcompatibility基準を満たしていないからダメだもん」

横棒類は全部 HYPHEN-MINUS に置き換えでいい
コメント1件

494
デフォルトの名無しさん[sage]   投稿日:2016/09/10 02:47:21  ID:J+ikgNSp.net
グダグダ言ってるとユニコード貼るぞ
俺のユニコードでお前は瞬殺

495
デフォルトの名無しさん[sage]   投稿日:2016/09/10 12:24:25  ID:fOA1OM1A.net
ユニコードは犯罪だからやめてください!

496
デフォルトの名無しさん[sage]   投稿日:2016/09/12 10:27:24  ID:mOa6Tuog.net
そこはユニコ-ドでしょ

497
デフォルトの名無しさん[sage]   投稿日:2016/09/12 14:27:32  ID:gUHt3FEA.net
>493
unicode character databaseと言うものがありましてねえ
コメント1件

498
デフォルトの名無しさん[sage]   投稿日:2016/10/03 15:40:21  ID:KTjG7pFJ.net
>497
で?

499
デフォルトの名無しさん[sage]   投稿日:2016/10/05 18:49:51  ID:zQFtnK8f.net
来年は JIS X 0201/0208/0213/0213/0218 の見直し時期だけど
果たして 0208 と 0213 の大統合計画は進んでいるのかしら。

500
デフォルトの名無しさん[sage]   投稿日:2016/10/05 20:58:30  ID:XMn6/PJL.net
大統領計画に見えた

501
デフォルトの名無しさん[sage]   投稿日:2016/10/05 21:43:58  ID:7xdnHvuf.net
もうJISなんて誰も読んでないから更新するだけ無駄
コメント2件

502
デフォルトの名無しさん[sage]   投稿日:2016/10/06 00:19:24  ID:WcwEO0Cy.net
なんだかんだいろいろな場から参照されるしUnicodeの中の人も読まざるを得ないから
うんこ絵文字のバリエーション大量に紛れ込ませてUnicodeにUnko Supplementとして収録させるチャンス

503
デフォルトの名無しさん[sage]   投稿日:2016/10/06 17:53:36  ID:UZIumrjL.net
ウンコはIVSの240まででお願いします
コメント1件

504
デフォルトの名無しさん[sage]   投稿日:2016/10/07 16:27:31  ID:a2swqPPf.net
>501
なわけないw

505
デフォルトの名無しさん[sage]   投稿日:2016/10/08 04:31:56  ID:Mitr01Lo.net
ようやく変体仮名は投票に進むことになったのか

506
デフォルトの名無しさん[sage]   投稿日:2016/10/10 18:05:59  ID:YNNS+rUA.net
>501
刷りで字形変えるとか狂気の沙汰やで

507
デフォルトの名無しさん[sage]   投稿日:2016/10/10 19:30:46  ID:cMA/MPGG.net
>503
そういえば例の絵文字の肌色セレクターってうんちの健康状態セレクターにも使えそうな気がしてきた

508
デフォルトの名無しさん[sage]   投稿日:2016/10/10 22:58:01  ID:M8ZVX+C6.net
うんこ色のカレーとうこん色のカレーを区別するのです

ケーキに黒っぽいVS付けたらチョコレートケーキとか
そういう汎用化は日本が提案したけど駄目だったんじゃなかったっけ?
肌の色が何とかなればいいんだってことで

509
デフォルトの名無しさん[sage]   投稿日:2016/10/10 23:51:20  ID:Djs1tw8b.net
モアイに色付けたら似てる人たくさんいるよな

510
デフォルトの名無しさん[sage]   投稿日:2016/10/11 20:05:00  ID:OtV2PYG6.net
カレー味のうんこ
うんこ味のカレー
の区別も必要(´・ω・`)

511
デフォルトの名無しさん[sage]   投稿日:2016/10/11 21:31:06  ID:cObrH7jL.net
本来モアイじゃなくてモヤイだけどな
コメント1件

512
デフォルトの名無しさん[sage]   投稿日:2016/10/11 21:50:29  ID:V1jdw+of.net
>511
だが誰も気にしない
http://emojipedia.org/moyai/
拳銃についてはあれだけ議論になるのにモヤイはモアイでいいみたい

513
デフォルトの名無しさん[sage]   投稿日:2016/10/11 22:41:02  ID:rvdgZgux.net
イースター島にあるのがモアイ、渋谷にあるのがモヤイだと思ってたw

514
デフォルトの名無しさん[sage]   投稿日:2016/10/12 16:00:26  ID:YOeAxYpE.net
本来はそれで合ってるはずなんだけどね

515
デフォルトの名無しさん[sage]   投稿日:2016/10/15 23:01:11  ID:D2M8VrAf.net
ユニコードのUAX#29(文字・単語・段落の抽出)を久しぶりに読んでみたら
Grapheme clusterの仕様が絵文字のルールに汚染されていた。
何なんだこの絵文字推しは。
コメント2件

516
デフォルトの名無しさん[sage]   投稿日:2016/10/16 12:53:03  ID:OdRyVeWS.net
>515
確かに追加されてる
けどemojiがある以上ルールを追加しないと仕方ないからしょうがない
合成使って性別modifierとかふざけてるけど

517
デフォルトの名無しさん[sage]   投稿日:2016/10/16 23:34:01  ID:WgPd64pv.net
この性別ってライオンのたてがみとか、人間以外にも使えるんだろうか

518
デフォルトの名無しさん[sage]   投稿日:2016/10/17 16:48:56  ID:aoY1HCI9.net
フィッツパトリック肌分類って6種類あるのに
何でUnicodeのEmoji Modifiersでは5つしか入れてないんだろう
"pale white skin"と"white skin"は区別しなくていいのか

519
デフォルトの名無しさん[sage]   投稿日:2016/10/17 18:02:36  ID:Mub28dKn.net
フィッツパトリック肌分類に基づいた上で1と2を一つにまとめて5段階にした
と書かれているんだから区別しなくていいと判断したんだろう
根拠は不明だが

520
デフォルトの名無しさん[sage]   投稿日:2016/10/17 18:48:57  ID:V2CfCREk.net
そこらへんすごく謎。まとめていいんかいと思った。

521
デフォルトの名無しさん[sage]   投稿日:2016/10/17 19:58:51  ID:0j2VVc+B.net
もうめちゃくちゃだよ

522
デフォルトの名無しさん[sage]   投稿日:2016/10/19 07:22:54  ID:2wj1sf6o.net
絵文字をざっくりしたシンボルじゃなくて
なまじリアルな絵で表現し始めちゃったのがそもそもの間違いなんだよな

523
デフォルトの名無しさん[sage]   投稿日:2016/10/19 18:20:20  ID:+yhFT7Q1.net
コードポイントを追加するのはともかく
modifierみたいなコードポイント列の解釈についての
ルール追加はやめて欲しいものだ

524
デフォルトの名無しさん[sage]   投稿日:2016/10/19 19:21:02  ID:z+7397V0.net
>515
あいつらクズばっか
文字採用基準もただの好みだし

525
デフォルトの名無しさん[sage]   投稿日:2016/10/27 22:59:57  ID:N8soLWiI.net
もうBase64か何か使って直接画像のバイナリデータ埋め込めばいいのに
Unicodeのコードポイントとして登録したがるのは何で
コメント1件

526
デフォルトの名無しさん[sage]   投稿日:2016/10/28 00:02:59  ID:JyUwGqf8.net
>525
画像だったら機械可読じゃないだろ。
バニーガールの性別と人種を機械的に判別できるようにすることは世界にとって有益だろ?

527
デフォルトの名無しさん[sage]   投稿日:2016/10/28 16:48:59  ID:p0VbpbVf.net
DoCoMoのiモード絵文字がNew York近代美術館のコレクションに | スラド モバイル
https://mobile.srad.jp/story/16/10/28/0416246/

The Original Emoji Set Has Been Added to The Museum of Modern Art’s Collection – MoMA – Medium
https://medium.com/moma/the-original-emoji-set-has-been-added-to...#.cqv1mudi0

New York’s MoMA Acquires the First Ever (Very Pixelated) Emoji | WIRED
https://www.wired.com/2016/10/new-yorks-moma-acquires-first-ever-pi...

528
デフォルトの名無しさん[sage]   投稿日:2016/10/28 18:45:52  ID:TvQWNHir.net
スレ違いレスを無言で貼るな低能

529
デフォルトの名無しさん[sage]   投稿日:2016/10/28 20:49:51  ID:fbqfS+Lz.net
絵文字がモノクロドット絵の頃は文字コード業界も平和だったのに

530
デフォルトの名無しさん[sage]   投稿日:2016/10/28 23:17:41  ID:oHvFUXop.net
自分たちでも扱える文字が増えたからって外人たちがはしゃぎすぎなんだよ

531
デフォルトの名無しさん[sage]   投稿日:2016/10/29 03:01:41  ID:V/VqPJHP.net
同じものを見てるとは限らないということを
ほとんどの利用者は知らずに誤解を生んでる

532
デフォルトの名無しさん[sage]   投稿日:2016/10/29 07:13:03  ID:p4X+nISr.net
\100

533
デフォルトの名無しさん[sage]   投稿日:2016/10/29 10:42:34  ID:hDIKHPTa.net
どう転んでも表意文字とコンピュータは相性が悪いらしいな
まさか絵文字の肌の色が問題になるとは思わんかったわ

534
デフォルトの名無しさん[sage]   投稿日:2016/10/29 10:59:34  ID:W9gQheBG.net
ああいう指示は文字コードの範疇じゃないよな。
そのうちなし崩しで、ボールドにしろだのサンセリフ体にしろだのいう指示まで取り込んでしまいそうな。

535
デフォルトの名無しさん[sage]   投稿日:2016/10/29 11:11:13  ID:SNFlkCRz.net
まぁ間違いなくそのうちアニメーションさせようとか言い出すだろうな

国内では文字コード濫用形式の絵文字から、単なる画像添付のデコメ絵文字に移行してたのに
なぜわざわざ国際規格で文字コード濫用形式に戻してしまったのか
コメント1件

536
デフォルトの名無しさん[sage]   投稿日:2016/10/29 14:02:02  ID:QoegAjAm.net
日本人がいろいろ工夫したものを、当の日本人自身がガラパゴスとか
言い出してダメにしちゃうから、問題点とかがきちんと伝承されないんだよ。

537
デフォルトの名無しさん[sage]   投稿日:2016/10/30 01:29:55  ID:X0WLh33u.net
EUCとかSJISとかISO2022とか揉めてる間にUTF8に持っていかれた感じ

538
デフォルトの名無しさん[sage]   投稿日:2016/10/30 09:34:26  ID:VFHN3+TL.net
そこはべつにもめてない

539
デフォルトの名無しさん[sage]   投稿日:2016/10/30 10:57:24  ID:QmnxrLM3.net
UTF-8とUTF-32に統一したいのに
WindowsがシフトジスとUTF-16の呪いをかけたままだから困る
もうWindowsごと滅んでもらうしか無い

540
デフォルトの名無しさん[sage]   投稿日:2016/10/30 18:49:52  ID:K5Y8T0Gi.net
よくわかってない人にありがちな見当違い発言
コメント1件

541
片山博文MZ ◆T6xkBnTXz7B0 [sage]   投稿日:2016/10/30 18:57:43  ID:cdJKNnsC.net
Windowsはメモ帳もオフィスもUTF-8ファイルに対応しているよ。
WideCharToMultiByteなどもCP_UTF8付ければ変換できる。

542
デフォルトの名無しさん[sage]   投稿日:2016/10/30 19:06:13  ID:d4hFjYHp.net
反論になってないし片山はやっぱりアホだな
Windowsがある限りUTF-16も生き残る、まさに呪いだな

543
デフォルトの名無しさん[sage]   投稿日:2016/10/30 20:50:41  ID:0D55JhhC.net(2)
いつも博文がクソレスで皆様を不愉快にさせて申し訳ございません
>540のクソレスもいつものように博文がID変えた自演です

544
デフォルトの名無しさん[sage]   投稿日:2016/10/30 20:53:09  ID:0D55JhhC.net(2)
結合文字はともかく土吉(U+20BB7)の文字列の
長さが2になるのはホント、ストレスたまるぜ

545
デフォルトの名無しさん[sage]   投稿日:2016/10/30 23:02:05  ID:qhy1bgov.net
>535
日本では絵文字は文字として運用実績があったからね
キャリアごとの独自絵文字をGmailで相互運用するために整理が必要だった
整理できてしまえばあとはUnicode.orgがどう考えるか
丸囲み合成文字辺りから考えると当然の帰結だったんじゃないか

546
デフォルトの名無しさん[sage]   投稿日:2016/10/31 04:36:11  ID:jkUzecbb.net(3)
NIHON

HINOMOTO

547
デフォルトの名無しさん[sage]   投稿日:2016/10/31 04:37:51  ID:jkUzecbb.net(3)
char * -> UTF-8
wchar_t * -> UTF-16
UTF-32 は何使うの?

548
デフォルトの名無しさん[sage]   投稿日:2016/10/31 05:24:15  ID:OEIemcR6.net
char16_t : UTF-16
char32_t : UTF-32

549
デフォルトの名無しさん[sage]   投稿日:2016/10/31 05:26:59  ID:jkUzecbb.net(3)
x

550
デフォルトの名無しさん[sage]   投稿日:2016/10/31 16:40:00  ID:up1CNSO3.net
日本の3大キャリアの絵文字を収録するのはまだいいとしてもその後の毎年山盛り追加はもう何がなんだかなあ・・・
コメント1件

551
デフォルトの名無しさん[sage]   投稿日:2016/10/31 16:44:21  ID:oRn+7MiJ.net
KOREAの陰謀としか

552
デフォルトの名無しさん[sage]   投稿日:2016/10/31 21:20:59  ID:YB1o5gLr.net
以下、コレはまいったね禁止
コメント1件

553
デフォルトの名無しさん[sage]   投稿日:2016/10/31 21:43:52  ID:8iOXYzaz.net
>552
どういう意味?

554
デフォルトの名無しさん[sage]   投稿日:2016/11/01 08:59:37  ID:f9g8VI31.net
親父ギャグ

555
デフォルトの名無しさん[sage]   投稿日:2016/11/01 18:38:34  ID:gPz02xlo.net
>550
最初の頃言ってた携帯メールの交換のためとか何だったんだろうね

556
デフォルトの名無しさん[sage]   投稿日:2016/11/01 19:26:48  ID:fE64ynNP.net
携帯絵文字は絶滅の危機
博物館で保護する必要がある
コメント1件

557
デフォルトの名無しさん[sage]   投稿日:2016/11/01 20:47:25  ID:E4vkOEuq.net
MoMAに収蔵されたから大丈夫

558
デフォルトの名無しさん[sage]   投稿日:2016/11/01 20:51:59  ID:o060wXK0.net
MoMAって秘宝館レベルのものも集めてるイメージ

559
デフォルトの名無しさん[sage]   投稿日:2016/11/01 22:32:57  ID:SkcuWYL1.net
ゴミみたいな絵文字が増えるのはまだいい。
JPの2文字で日本の国旗、という
クソな絵文字を持ち込んだ奴は死刑でいい。
コメント1件

560
デフォルトの名無しさん[sage]   投稿日:2016/11/02 01:14:19  ID:FB0eoin4.net
MoMAに収蔵されたケータイ絵文字なんてほんの一部でしかないな

561
デフォルトの名無しさん[sage]   投稿日:2016/11/02 02:56:25  ID:pCipYitj.net(2)
>556
オックスフォード辞典の「今年の言葉」の一つに選ばれてるくらい欧州でもインターネット上を絵文字が席巻してるんだぞ
コメント1件

562
デフォルトの名無しさん[sage]   投稿日:2016/11/02 04:10:14  ID:6UbvFxVg.net
>561
まさか Unicode Emoji と ケータイ絵文字の違いを知らない?
コメント1件

563
デフォルトの名無しさん[sage]   投稿日:2016/11/02 04:27:56  ID:pCipYitj.net(2)
>562
派生関係にあるだけで同じものです
対応表もあります
コメント1件

564
デフォルトの名無しさん[sage]   投稿日:2016/11/02 17:23:17  ID:foEqKcGp.net
>563
560はそんな大雑把な話ではないでしょ

565
デフォルトの名無しさん[sage]   投稿日:2016/11/03 03:34:51  ID:iYejUQc8.net
文字コードてすと
surströmming

566
デフォルトの名無しさん[]   投稿日:2016/11/03 19:21:23  ID:SywuufG2.net

567
デフォルトの名無しさん[sage]   投稿日:2016/11/04 15:58:47  ID:fFiZW1of.net
>559
🇸🇪🇸🇪
ってTwitterに書き込んだらスウェーデンの国旗に対応してなくて
間の二文字がスペインの国旗として認識・表示されたって話
マヌケですき
コメント1件

568
デフォルトの名無しさん[sage]   投稿日:2016/11/04 16:48:18  ID:LPswLb4k.net
>567
え、なんだそれ。

てっきり1文字目用と2文字目用で別のポイントになってるのか、
あるいは始点か終点を示す符号があるんだと思ってた。

単に2文字続けば国、って仕様なのか。Unicodeも悪いな。

569
デフォルトの名無しさん[sage]   投稿日:2016/11/04 22:15:07  ID:oa5V2Sux.net
Unicode関係ないw

570
デフォルトの名無しさん[sage]   投稿日:2016/11/04 22:48:05  ID:z+k+W3df.net
いや関係あるでしょ。
UTF-16のように1文字目と2文字目を分けておけばそんなことにはならなかった。

571
デフォルトの名無しさん[sage]   投稿日:2016/11/04 23:05:51  ID:uRr6P/SX.net
TwitterがUnicodeに完全に対応してればそんなことにはならなかった。
コメント1件

572
デフォルトの名無しさん[sage]   投稿日:2016/11/04 23:59:11  ID:yGjCinWT.net
>571
完全に対応kwsk
国旗周りの処理の詳しい規定ってあったっけ
コメント1件

573
デフォルトの名無しさん[sage]   投稿日:2016/11/05 00:13:28  ID:xEDyoPf+.net
前後の区別がないと、SUSE とかのときどうするのか気になる。

単純に区切ると SU | SE で

[ソ連国旗] [スウェーデン国旗]

だけど、SU の国家は現存しない。

だとすると別の可能性として S | US | E 、つまり

[S] [米国国旗] [E]

もありえそう。
コメント1件

574
デフォルトの名無しさん[sage]   投稿日:2016/11/05 01:01:33  ID:gWLGUGo0.net
>573
> [S] [米国国旗] [E]

普通に先頭から判別すればそうなる
少なくてもfirefoxではたぶんそう→ 🇸🇺🇸🇪
コメント2件

575
デフォルトの名無しさん[sage]   投稿日:2016/11/05 01:16:57  ID:mXzE/KRi.net(2)
どの2文字をペア扱いすべきかはISO国名コードの最新版に存在するかどうかを見ないと分からないってことか。ややこしいな。

576
デフォルトの名無しさん[sage]   投稿日:2016/11/05 01:20:47  ID:mXzE/KRi.net(2)
いや、最新版だけじゃだめなのか。過去のメールは送信当時のコード表を使わないと>574みたいに半分ズレて別の国に化けるな。

577
デフォルトの名無しさん[sage]   投稿日:2016/11/05 01:57:45  ID:fdLm2JUj.net
既にGB­-SCT(英国スコットランド)とか提案されてるし気にしても仕方ない
コメント2件

578
デフォルトの名無しさん[sage]   投稿日:2016/11/05 04:17:16  ID:fdfHcDbP.net(2)
>572
偶数で切ることになっている

UAX#29
『Do not break within emoji flag sequences. That is, do not break between regional indicator (RI) symbols if there is an odd number of RI characters before the break』
『[^RI] (RI RI)* RI×RI』
UTS51
『A sequence of two Regional Indicator characters』

579
デフォルトの名無しさん[sage]   投稿日:2016/11/05 04:21:04  ID:fdfHcDbP.net(2)
↑の「×」はコードポイント列から一文字を抽出するときに
別の文字に切り離してはいけないという意味

580
デフォルトの名無しさん[sage]   投稿日:2016/11/05 07:07:22  ID:r4TaQ56a.net
>574
firefox ESR(45.4.0)では国旗フォントがあるかどうかで区切りが変わるいい加減さ
sssp://o.8ch.net/irg8.png
コメント1件

581
デフォルトの名無しさん[sage]   投稿日:2016/11/05 12:09:56  ID:i7MWnHHH.net
>580
いい加減というか逆にめんどくさいことをわざわざって気がする

582
デフォルトの名無しさん[]   投稿日:2016/11/05 14:59:08  ID:vOTzCdKc.net
>577-578
GBSCTGBSCTと2つ並べるとGB SC TG BS CT に分解されそう(最後のCT以外全部あるっぽい)。
コメント1件

583
デフォルトの名無しさん[sage]   投稿日:2016/11/05 16:22:05  ID:qKcyypJI.net
DNAの塩基配列も文字コードになったんでしたっけ?

584
デフォルトの名無しさん[sage]   投稿日:2016/11/05 16:44:27  ID:9npC26KJ.net
絵とスタイルは別のフォーマットがあるんだからそっちに委ねるべきだよな
もともとそういう方針のはずだし

585
デフォルトの名無しさん[sage]   投稿日:2016/11/05 17:02:26  ID:9y8+ngHb.net
>577
GB-○○と同じ要領でJP-○○で都道府県旗も出せるようになるのかな、と思ったけど、
よく考えたらRIってアルファベットしかないから数字使うJP-○○は無理やん。欧米ずるい。
俺も神奈川県のおちんちんマーク出したい。
http://www.pref.kanagawa.jp/uploaded/image/700113.gif
コメント1件

586
デフォルトの名無しさん[sage]   投稿日:2016/11/05 17:54:33  ID:Cvv2kfJC.net(2)
iconvライブラリがマルチスレッド対応してない…。orz
コメント1件

587
デフォルトの名無しさん[sage]   投稿日:2016/11/05 18:44:59  ID:6heu2Wv+.net
ICUを使ってみては
コメント1件

588
デフォルトの名無しさん[sage]   投稿日:2016/11/05 21:04:55  ID:TjgsNfuE.net
>585
TK=東京とかKN=神奈川みたいなのを決めりゃいいじゃん

589
デフォルトの名無しさん[sage]   投稿日:2016/11/05 21:24:55  ID:BG7LImn0.net(2)
絵文字のために3166-2:JPを更新するの?

590
デフォルトの名無しさん[sage]   投稿日:2016/11/05 22:48:27  ID:ALhaJQoB.net
REGIONAL INDICATOR SYMBOLSってISO 3166-1の形式に従う必要はあったのだろうか

591
デフォルトの名無しさん[sage]   投稿日:2016/11/05 23:08:08  ID:BG7LImn0.net(2)
従うというか、ISOに外部化しないとどの旗を収録するか(→どこを国家とみなすか)で揉めてしまう。
純粋に人任せにすることで「うちは政治的判断はしてませんよ」ってそ知らぬふりができる。

592
デフォルトの名無しさん[sage]   投稿日:2016/11/05 23:31:17  ID:Cvv2kfJC.net(2)
>587
助言ありがとう。ICU、試してみます。

593
592[]   投稿日:2016/11/06 15:59:49  ID:0naNG629.net(4)
iconvがマルチスレッド対応していないってのは私の勘違いだった。
icuとiconv、両方ともマルチスレッド対応していた。
Win32環境での文字コード変換の速度比は以下の通りになった。
Win32API は、WideCharToMultiByte() 等を使った。

Win32API : cygwin-iconv : cygwin-icu = 1 : 3 : 2
コメント1件

594
デフォルトの名無しさん[sage]   投稿日:2016/11/06 16:12:34  ID:bCh//xB2.net
速度比?
時間比じゃなくて?
コメント1件

595
592[]   投稿日:2016/11/06 16:49:22  ID:0naNG629.net(4)
やはり波ダッシュ「〜」、「〜」が鬼門。

>594
失礼しました。所要時間の比です。

596
デフォルトの名無しさん[sage]   投稿日:2016/11/06 18:14:05  ID:O2/niCOA.net
>586
glibcのiconvはMT-Safe
ただiconv_openの返り値(iconv_t)は排他して使わないと駄目
コメント1件

597
592[]   投稿日:2016/11/06 19:53:07  ID:0naNG629.net(4)
なぜiconvがマルチスレッド対応してないと思い込んでしまったかというと、
cygwinでC++11の thread クラスで work() と join() を使ったマルチスレッドの小さい勉強用プログラムを試しに書いたんだけど、
処理の所要時間を得るために、clock()で計時したんだけど、その数値がデタラメだったことが原因。
cygwinのclock()の戻り値の信頼性がここまで低いとは知らなかった。

>596
了解。ハンドルを複数スレッドで使いまわすつもりは最初からなかったです。
ライブラリ関数内部で排他ロックしてるのかと思い込んだ私のミス。

処理速度・将来性・プロジェクトの活発さを考えると、iconvよりicuの方が有望に思える。

598
デフォルトの名無しさん[sage]   投稿日:2016/11/06 20:21:34  ID:t7rcT7E/.net
次はmingwでもテストしてくれ

599
592[sage]   投稿日:2016/11/06 23:12:19  ID:0naNG629.net(4)
mingw系は、GitやStrawberry Perlに付属のMINGWのbinがPATHに入り込んでいて、無事にmakeを貫徹することさえままならないので当分報告できない。あしからず。
コメント1件

600
デフォルトの名無しさん[sage]   投稿日:2016/11/06 23:41:14  ID:eMFucsGq.net
プログラムを組むような人なら普通はPATHなんていくらでも変更出来るけど
ままならないなら仕方ない

601
デフォルトの名無しさん[sage]   投稿日:2016/11/07 04:13:30  ID:EaPQMBZD.net
>599
インストーラーが「PATHを設定しますか?」で選択しを与えてくれてるのに
読まないでパコパコインストールしまくる馬鹿ですね

602
デフォルトの名無しさん[sage]   投稿日:2016/11/07 15:01:03  ID:/3CQ/LxZ.net
これ以上片山に構わないで

603
デフォルトの名無しさん[sage]   投稿日:2016/11/07 16:58:00  ID:zyvBBkK2.net
>582
マジレスしていいのかわからんがそれはISO 3166-1じゃなくてISO 3166-2だろと

604
デフォルトの名無しさん[sage]   投稿日:2016/11/07 17:22:52  ID:Tzo661xQ.net
マジレスはいいが前後も読んだほうがより良い

605
デフォルトの名無しさん[sage]   投稿日:2016/11/07 17:45:16  ID:2+R9ECvu.net
なお、3166-2のやつはRI使わない方向のようなのでほとんどの問題は解決されそう。
ただそうなるとますますあの不出来なRIって何だったのかって感じに。

606
592[]   投稿日:2016/11/07 22:27:59  ID:6EByQkLc.net
mingwでiconv, icuを試した。
iconvは、MINGW Installation Managerが提供するバイナリを使用した。
icuはバイナリは提供されていないのでソースからビルドした。
icuはそのままだとlocale関連のAPIが公開されていないMINGW版がビルドができないので、
_create_locale() と _free_locale() のダミー関数をソースに追記してビルドを通した。
所要時間の比は以下の通り。
MINGWだと、iconv、icuともWin32とあまり違いがないようだ。

Win32API : mingw-iconv : mingw-icu = 1 : 1.08 : 1.11

なお、>593 でのcygwinは、iconv、icuともにcygwin用に提供されているバイナリを利用している。

607
デフォルトの名無しさん[sage]   投稿日:2016/11/08 00:48:57  ID:unHUC1CF.net
cygwin1.dllとか軽油してるから遅いんだろ

608
デフォルトの名無しさん[sage]   投稿日:2016/11/08 01:14:10  ID:Q1ozlGt4.net
変換する文字列の長さが短すぎて
変換速度よりもsystem callの呼び出し速度のベンチになってない?

609
デフォルトの名無しさん[sage]   投稿日:2016/11/08 09:16:34  ID:WBfil5Sr.net
生の値(時間)を書くのが普通
比率という時点で何か隠してるようにみえる

610
デフォルトの名無しさん[sage]   投稿日:2016/11/08 11:50:26  ID:ZBAGJV1u.net
するどいな

611
592[]   投稿日:2016/11/08 20:34:22  ID:qWOFxdzf.net
無駄な情報を捨てて必要な情報だけ提供した善意を、悪意を持って隠したと曲解する人がいて面白い。トランプ支持者っぽい。
テストプログラムやら実行環境やらまで公開して他の人が再現できるようにでもしない限り、生の実測時間を提示する意味はない。

612
デフォルトの名無しさん[sage]   投稿日:2016/11/08 20:41:20  ID:IHq5KhUT.net
トランプ流れ弾

613
デフォルトの名無しさん[sage]   投稿日:2016/11/08 22:32:50  ID:HtqjUltN.net
同じ10倍でも例えばミリ秒のオーダーと秒のオーダーでは全然違う。
計測時間そのままコピペする方が楽だろうに、態々比率に直すのは、、、
パワポ資料作るお仕事の人と見た。

614
デフォルトの名無しさん[sage]   投稿日:2016/11/10 16:00:00  ID:UEg1zsO/.net
JIS X 0201/0208/0213がいつの間にか

> 2016-10-20 確認

になってる。
今回は特に何もなしか(あったらまた困るけど)
というか改正来年じゃなかったのか……。

615
デフォルトの名無しさん[sage]   投稿日:2016/11/10 20:40:08  ID:Ow2XdUNn.net
来年が色んな意味で楽しみだわ

616
デフォルトの名無しさん[sage]   投稿日:2016/11/11 13:37:59  ID:8vg+pXNE.net
JISってそれぞれ何刷まで出てるんだっけ?
刷ごとの差分知りたい
コメント1件

617
デフォルトの名無しさん[sage]   投稿日:2016/11/11 15:58:27  ID:Y1SxtmaI.net
0208の1978年版とか2012年版とかじゃなくて刷?

http://okazaki.sakuraweb.com/biboroku/78jis/78jis.html

によるとJIS C 6226-1978は少なくとも第7刷まで増刷されたらしいけど、
JSAとかJISCに問い合わせても多分当時の資料とか無いだろうな。
コメント1件

618
デフォルトの名無しさん[sage]   投稿日:2016/11/12 15:38:19  ID:q7jUFepj.net
>616
刷は改定ごとに一から始まるので刷ごとの差は無い
そしてJISは様々な規格があるのでJISが何刷ということは言えない
コメント1件

619
デフォルトの名無しさん[sage]   投稿日:2016/11/13 13:47:22  ID:ueOqX8wJ.net
78JIS以外は何刷でも内容一緒でしょ正誤票の反映はあるだろうけど

620
デフォルトの名無しさん[sage]   投稿日:2016/11/14 16:40:47  ID:nhwER5sG.net
Unicode 10.0の絵文字候補、人魚は男女対応可能に | スラド IT
http://it.srad.jp/story/16/11/12/191218/

まーた増えるのか、、、

621
デフォルトの名無しさん[sage]   投稿日:2016/11/14 16:57:09  ID:YqiB904W.net(2)
なんでもかんでもZWJでいくなら最初から人間+魚でよかった。

そしてうっかり順番を入れ替えて魚+人間にすると……!!

622
デフォルトの名無しさん[sage]   投稿日:2016/11/14 17:40:54  ID:rIoU2mi1.net(2)
マーパーソンwww

623
デフォルトの名無しさん[sage]   投稿日:2016/11/14 17:48:16  ID:rIoU2mi1.net(2)
俺がもっとクールな新絵文字考えたぜつって、合字でオレオレ絵文字ZWJ実装するフォントが現れだして収集つかなくなりそう
コメント1件

624
デフォルトの名無しさん[sage]   投稿日:2016/11/14 18:00:03  ID:zlxXdLUF.net
これはひどい

625
デフォルトの名無しさん[sage]   投稿日:2016/11/14 18:50:06  ID:YqiB904W.net(2)
>623
うわありそうで怖い。
PUAと違って意味があるぶん、
大手が流行らせた合成絵文字はそのまま追認するしかない未来が見える。

例えばTwitterとか、Android OSとかがオレオレ絵文字実装したら
一般人が違いに気付かずに使って膨大な使用例ができるよね……

626
デフォルトの名無しさん[sage]   投稿日:2016/11/15 12:41:03  ID:r6BgB6bM.net
ZWJ方式は、合成されなくても意味は通じるってことでしょ

627
デフォルトの名無しさん[sage]   投稿日:2016/11/15 13:27:53  ID:U3Mmtdzs.net
WhatsAppがかんがえたさいきょうのZWJ絵文字
http://emojipedia.org/olympic-rings/

なお合成されなかったら意味は通じない模様
コメント1件

628
デフォルトの名無しさん[sage]   投稿日:2016/11/15 21:17:34  ID:gEiNDmpT.net
ちゃんと色指定も加え入れろ〜

629
デフォルトの名無しさん[sage]   投稿日:2016/11/15 21:50:35  ID:PldPJ2O3.net
合成するぐらいなら
文字列の途中にエンコードしたビットマップを挟み込めるようにしろ
コメント1件

630
デフォルトの名無しさん[sage]   投稿日:2016/11/15 21:55:34  ID:cUgefh1P.net
─○○○

631
デフォルトの名無しさん[sage]   投稿日:2016/11/16 02:59:36  ID:zr+5k25B.net
>627
大きい丸自体が元をたどれば合成文字用なのが面白い

632
デフォルトの名無しさん[sage]   投稿日:2016/11/16 02:59:39  ID:fzskfnoe.net(2)
談合三本

633
デフォルトの名無しさん[sage]   投稿日:2016/11/16 03:01:10  ID:fzskfnoe.net(2)
>629
たしかに

634
デフォルトの名無しさん[sage]   投稿日:2016/11/16 16:58:25  ID:uL/NV7s7.net
むしろ合成したいなら U+20DD COMBINING ENCLOSING CIRCLE なんじゃ

635
デフォルトの名無しさん[sage]   投稿日:2016/11/19 01:04:22  ID:/7Uc3cKm.net
ツ郤衙ワ
https://www.google.co.jp/#q=%EF%BE%82%E9%83%A4%E8%A1%99%EF%BE%9C

636
デフォルトの名無しさん[sage]   投稿日:2016/11/19 21:24:14  ID:h19DOfQp.net
>617
>618
刷はある
同じ規格のはずなのに刷で例示字形に差がある時もあって、それを整理したいんだよね

637
デフォルトの名無しさん[sage]   投稿日:2016/11/20 03:55:56  ID:pv3IyT3Y.net
古典の研究は資料の調査収集から始まる

638
デフォルトの名無しさん[sage]   投稿日:2016/11/24 20:15:24  ID:V+CGDzRP.net
ーヲノイクゥ
イャサウクゥ
ケ篥ホクゥ
ケュナ邵ゥ
サースナクゥ
サウキチクゥ
ソキウ羣ゥ
タ鯱ユクゥ
タナイャクゥ
ツ郤衙ワ
ツ醋ャクゥ
トサシ雕ゥ
ナ郤ャクゥ
ニ猥ノクゥ
ニチナ邵ゥ
ニハフレクゥ
ノルサウクゥ
ハ。ー貂ゥ
ハ。イャクゥ
ハ。ナ邵ゥ
ハシクヒクゥ
ヒフウ、ニサ
マツイホサウクゥ

639
デフォルトの名無しさん[sage]   投稿日:2016/11/25 09:57:28  ID:M66ENQJY.net
愛媛県
岡山県
高知県
広島県
三重県
山形県
新潟県
千葉県
静岡県
大阪府
大分県
鳥取県
島根県
奈良県
徳島県
栃木県
富山県
福井県
福岡県
福島県
兵庫県
北海道
和歌山県

640
デフォルトの名無しさん[sage]   投稿日:2016/11/25 12:21:36  ID:n3LE76D7.net

641
デフォルトの名無しさん[sage]   投稿日:2016/12/19 05:55:33  ID:rp7MwxOA.net
さて

642
デフォルトの名無しさん[sage]   投稿日:2016/12/26 16:22:22  ID:dYEGDg58.net
ISO/IEC 10646:2016 (5th Edition)は2017になりそうだな。

643
デフォルトの名無しさん[]   投稿日:2016/12/26 20:13:30  ID:TRnwbnfO.net

644
デフォルトの名無しさん[sage]   投稿日:2016/12/28 05:19:29  ID:cqk+d7uG.net
コード?
コメント1件

645
デフォルトの名無しさん[sage]   投稿日:2016/12/28 07:28:33  ID:XevzpVey.net(3)
>110
おいおい、ちゃんと規格読んでる?
原則、部首画数順だぞ。unihanデータベースも推奨ソートキーが部首画数順になってる。

646
デフォルトの名無しさん[sage]   投稿日:2016/12/28 07:35:34  ID:XevzpVey.net(3)
>160
昔の区点表現でいう2区毎にまとめて突っ込んだせいだろう。

647
デフォルトの名無しさん[sage]   投稿日:2016/12/28 07:42:45  ID:XevzpVey.net(3)
>244
いわゆるハングルの大移動ですね。

648
デフォルトの名無しさん[sage]   投稿日:2016/12/28 09:58:25  ID:aMFxqRcr.net
突然遠投大会始めるのやめてもらえます

649
デフォルトの名無しさん[sage]   投稿日:2016/12/28 12:34:27  ID:kFL7wfb2.net
>644
50音カナで50進数にして管理してるんだと

650
デフォルトの名無しさん[sage]   投稿日:2016/12/28 13:11:56  ID:hpQZCApo.net
カナって50個もあるの?

651
デフォルトの名無しさん[sage]   投稿日:2016/12/28 13:14:02  ID:45reyBmE.net
もっとある

652
デフォルトの名無しさん[sage]   投稿日:2017/01/01 20:44:48  ID:4U7a/Vzr.net
明けましておめでとうございます
2017年の文字コード業界はどうなるやら

653
デフォルトの名無しさん[sage]   投稿日:2017/01/01 21:18:20  ID:9MvoRZrQ.net
VCでUTF-8のBOM無し突っ込めると判ったのが2016の最大の収穫

654
デフォルトの名無しさん[]   投稿日:2017/01/06 14:36:30  ID:XtKi9eaG.net
test

655
デフォルトの名無しさん[sage]   投稿日:2017/01/19 22:54:33  ID:xPn9j90t.net(2)
testだと?

656
デフォルトの名無しさん[sage]   投稿日:2017/01/19 23:22:23  ID:kAhgSygC.net
ユニコードコンソーシアムのProposed New Charactersみてたら
HIRAGANA LETTER SMALL WI、HIRAGANA LETTER SMALL WE、HIRAGANA LETTER SMALL WO、
KATAKANA LETTER SMALL WI、KATAKANA LETTER SMALL WE、KATAKANA LETTER SMALL WO、
KATAKANA LETTER SMALL N
つまり小さい「ゐ」「ゑ」「を」「ヰ」「ヱ」「ヲ」「ン」があった。
小さい「こ」と「コ」は以前U+1B002とU+1B003に提案されてたが
そこは変体仮名が入ることになってU+1B127、U+1B128に変わってた。
変体仮名の数が多すぎてKana Supplementブロックに入り切らなかったから
その直後のU+1B100〜U+1B12FにKana Extended-Aブロックを作るんだな。
でU+1B100〜の予定だった女書は1B170〜にずれた。
コメント1件

657
デフォルトの名無しさん[sage]   投稿日:2017/01/19 23:41:32  ID:L5ppZzRV.net
荒らしは去れ
ここはトイレの落書きやお前の日記ではない

658
デフォルトの名無しさん[sage]   投稿日:2017/01/19 23:58:14  ID:xPn9j90t.net(2)
佳那サプリメントでかいなあと思ってたのに足りなかったのか

659
デフォルトの名無しさん[sage]   投稿日:2017/01/20 01:09:17  ID:1c/0Zcpc.net
>656
女書ってなに?

660
デフォルトの名無しさん[]   投稿日:2017/01/20 04:21:35  ID:SuI25zgd.net
美乳

661
デフォルトの名無しさん[sage]   投稿日:2017/01/20 08:06:23  ID:B05iL6IP.net
↑いまだにEUC使ってる奴

662
デフォルトの名無しさん[sage]   投稿日:2017/01/20 08:57:48  ID:TRhLZIcU.net
芸柏l

663
デフォルトの名無しさん[]   投稿日:2017/01/20 13:48:47  ID:XOQ1SR2o.net
平成

664
デフォルトの名無しさん[sage]   投稿日:2017/01/20 16:02:46  ID:HZJT4SPy.net
UTF-8と称しつつ実際はISO/IEC 8859-1(or Windows-1252)使ってるサイト早く絶滅しないかな〜。

665
デフォルトの名無しさん[sage]   投稿日:2017/01/20 23:22:01  ID:2XlTkpSB.net
うむ

666
デフォルトの名無しさん[sage]   投稿日:2017/01/22 23:54:36  ID:I5eFmZgm.net
シマンテックのインストーラー「Symantec? Veritas NetBackup?をインストールします」
俺「俺は今 何をインストールしているんだぜ…?」

667
デフォルトの名無しさん[sage]   投稿日:2017/01/23 13:38:14  ID:vFvi2mPp.net
マカフィー()よりまし

668
デフォルトの名無しさん[sage]   投稿日:2017/01/25 14:44:24  ID:/N/oPPcM.net
©と®が化けるのはあるある

669
デフォルトの名無しさん[sage]   投稿日:2017/01/25 15:54:19  ID:O1e4fHbH.net
Windows 2000あたりのセットアップ画面(ブルースクリーン)は左上に

ソソソソソソソ

みたいなのが並んでた気がするんだけどあれは何が化けていたんだろう。
コメント3件

670
237[sage]   投稿日:2017/01/25 22:09:22  ID:gTVlV55T.net
>669
CP437?

671
デフォルトの名無しさん[sage]   投稿日:2017/01/25 23:28:05  ID:yhKKEJSl.net
CP237?

672
デフォルトの名無しさん[sage]   投稿日:2017/02/03 11:13:08  ID:qUN7oehH.net
>669
頭にオがあったんじゃないかな

673
デフォルトの名無しさん[sage]   投稿日:2017/02/03 15:53:54  ID:AImPimr2.net
ソじゃなくてヘだな

Windows 2000 Setup
ヘヘヘヘヘヘヘヘヘヘヘヘヘヘヘヘヘヘヘヘ

674
デフォルトの名無しさん[sage]   投稿日:2017/02/06 16:58:49  ID:1iv5Awq0.net
>669-673
なるほど、

https://en.wikipedia.org/wiki/Code_page_437
https://ja.wikipedia.org/wiki/JIS_X_0201

最初は CP437 の 0xCD “═” だったのが
何かの拍子にシフトJISとして解釈されて
JIS X 0201 の 0xCD “ヘ” に化けたということか。
コメント1件

675
デフォルトの名無しさん[sage]   投稿日:2017/02/06 21:27:31  ID:oVOmv7r6.net
>674
正体は罫線か。

こういう解明ってすっきりするし面白いね。

676
デフォルトの名無しさん[sage]   投稿日:2017/02/19 22:58:26  ID:IU+vTkdD.net
ISO/IEC 10646 - Information technology -- Universal Coded Character Set (UCS)
http://www.iso.org/iso/catalogue_detail.htm?csnumber=69119

ISO/IEC 10646:2017 (5th Edition) がいつの間にか published になってた。
Publicly Available Standards へ追加マダァ-? (・∀・ )っ/凵⌒☆チンチン

677
デフォルトの名無しさん[sage]   投稿日:2017/02/20 22:24:53  ID:coRAUu9w.net
>いつの間にか published になってた

文盲ってどうしようもないですねホント

678
デフォルトの名無しさん[sage]   投稿日:2017/02/20 23:48:25  ID:SiY39E3I.net
regional flagsって日本の都道府県旗も追加されんの?
東京の旗が銀杏か肛門かで揉めそう
コメント1件

679
デフォルトの名無しさん[sage]   投稿日:2017/02/21 00:45:25  ID:nlr0ZxeU.net
ってか日本の都道府県旗ってJISか何かで規格化されてるんだろうか
されてないなら根拠になる個別の条例を探して判断することになるのか
コメント1件

680
デフォルトの名無しさん[sage]   投稿日:2017/02/21 23:08:13  ID:YiL5XD0V.net
健全でない言葉が含まれているため表示しません 内容を確認する
コメント1件

681
デフォルトの名無しさん[sage]   投稿日:2017/02/22 03:17:26  ID:4ggKEg2C.net
旗の形ではなく県章部分だけでグリフ作ってもらえたらいろいろ独創的な応用が利きそうだ。
コメント1件

682
デフォルトの名無しさん[sage]   投稿日:2017/02/22 18:49:19  ID:/iBgHjnm.net
>679
絵と絵文字は別物やで
コメント1件

683
デフォルトの名無しさん[sage]   投稿日:2017/02/22 21:52:33  ID:h5L2bR5S.net
>682


言わんとすることがわからないけど、
基準があれば>678みたいな場合に難しい判断しなくてすむでしょ?
コメント1件

684
デフォルトの名無しさん[sage]   投稿日:2017/02/22 22:31:09  ID:j43AF9m9.net
もう憲法とか国境の位置もJIS規格で管理しちゃえよ

685
デフォルトの名無しさん[]   投稿日:2017/02/23 13:21:45  ID:eG9NqkD/.net(2)
>680
知らなかった
ありがとう
2ちゃんもたまには役に勃つな

686
デフォルトの名無しさん[sage]   投稿日:2017/02/23 13:22:51  ID:eG9NqkD/.net(2)
>681
自分でやれ

687
デフォルトの名無しさん[sage]   投稿日:2017/02/23 18:33:49  ID:g/wbAq9q.net
>683
仕様書読もうな
コメント1件

688
デフォルトの名無しさん[]   投稿日:2017/02/23 19:43:12  ID:lh6GP4kZ.net
🏳️‍🌈
🏴‍☠️

689
デフォルトの名無しさん[sage]   投稿日:2017/02/23 23:02:08  ID:Mc4LemLc.net
>687
どうもかみ合ってない気がする。
仕様できっちり規定されてれば楽だけどそういうものじゃないよね、
なら代わりになる典拠があれば楽なんだけどな、って話してたつもりなんだけど。

690
デフォルトの名無しさん[sage]   投稿日:2017/03/02 13:04:44  ID:Dk3HQyow.net
仕様を読んだ上でそんなこと言ってるなら、読解力が足りないとしか言えないわ

691
デフォルトの名無しさん[sage]   投稿日:2017/03/02 15:42:40  ID:fgh+r4bY.net
せっかく亀レスするならもうちょっと具体的に言えたほうがいいと思う

692
デフォルトの名無しさん[sage]   投稿日:2017/03/03 19:38:34  ID:r16C7uTR.net
もういくつ寝るとunicode10
ゾンビとか吸血鬼とかせっそうなさすぎ
こんな絵文字使われるのかよ
コメント1件

693
デフォルトの名無しさん[sage]   投稿日:2017/03/03 22:57:47  ID:m0VSWGlS.net
もう幾つ寝るとISO 10646発売
あと一週間ぐらいで出るだろきっと

694
デフォルトの名無しさん[]   投稿日:2017/03/04 12:37:47  ID:GRvQ2lmz.net
>692
他にやることあるのにね
無能なんだろ

695
デフォルトの名無しさん[sage]   投稿日:2017/03/04 17:17:33  ID:eGgxEr5u.net
すべての文字を収めるが目的のはずが
新しいアイコンを作ろうになってるからな

696
デフォルトの名無しさん[sage]   投稿日:2017/03/04 23:52:53  ID:+pEijc2g.net
絵文字なんか作ったってフォントごとに微妙に変わるし不毛だよ
何種類用意したって満足ってことはないし、無駄な仕事が増えるだけ
それならむしろ、エンコードしたビットマップかベクタグラフィックを
文字列の途中に文字として挿入できるようにしたほうがマシだろ

697
デフォルトの名無しさん[sage]   投稿日:2017/03/05 00:03:46  ID:xrJm/RDc.net
100種類用意しました
1000種類用意しました
10000種類用意しました
・・・
どこまでいってもこんなものは・・・
絵文字っていわゆるラインスタンプみたいな使われ方を想定しているんだろ?
すべてのラインスタンプに文字コードを割り振るみたいなものだ
時代に合ってない
文字列の途中にビットマップかベクタグラフィックを挟み込める方が絶対良いって
そうすると当然絵文字職人みたいな人たちが出てきてにぎわうだろうから
それをコピペして使えばよいのだ
標準化委員会みたいな中央で絵の形とコードを取り決めて・・・ってスタイルは時代遅れだよ
ラインスタンプを見ろよ

698
デフォルトの名無しさん[]   投稿日:2017/03/05 23:06:39  ID:nindsAFW.net
たしかに
特定のコードとそれに続く何byteかでbitmap図形っていうのはありかもね
無駄多いけど

699
デフォルトの名無しさん[sage]   投稿日:2017/03/06 08:18:41  ID:n/Fv95sm.net
最近の追加は絵文字じゃなくて絵になってるからな
文字コードに色を定義したり芯のない継接ぎ仕様でやりたい放題だよな

700
デフォルトの名無しさん[sage]   投稿日:2017/03/14 14:00:09  ID:+au4v4OR.net
Unicode 10、変体仮名と縦書きレイアウト導入へ | マイナビニュース
http://news.mynavi.jp/news/2017/03/13/110/

701
デフォルトの名無しさん[sage]   投稿日:2017/03/15 08:13:46  ID:eV3tx5Ei.net
縦書きテキストレイアウトってまたおかしなことになってんな
変体仮名は文字情報基盤の範囲ならいいんじゃね

702
デフォルトの名無しさん[sage]   投稿日:2017/03/15 08:24:44  ID:oPhy6OQw.net
縦書きレイアウトって前からあるこれのアップデートのことじゃないの?
http://www.unicode.org/reports/tr50/tr50-18.html#Modifications
「導入」ってのはその記事の誤認っぽい

703
デフォルトの名無しさん[sage]   投稿日:2017/03/15 11:37:12  ID:7YWEdixI.net
|のカーニングがおかしいとか

704
デフォルトの名無しさん[sage]   投稿日:2017/03/15 15:48:49  ID:tq6fONxP.net
「導入」ってのは

> さらに、Unicode Vertical Text Layoutが標準の一部として取り込まれる点が注目される。

って本文に書いてあるんだから Unicode® Technical Report が Unicode® Standard Annex に昇格して
Unicode® Standard の一部になるってことでしょ。

705
デフォルトの名無しさん[sage]   投稿日:2017/03/28 20:45:37  ID:2V3Jlzjb.net
おう吐・ゾンビ・授乳などUnicodeに新しい絵文字69種類が追加される
http://gigazine.net/news/20170328-69-new-emojis-announced/

706
デフォルトの名無しさん[sage]   投稿日:2017/03/28 22:50:13  ID:ky5+niZ/.net
こんだけ増えてくると幾らアホなアメリカ人でも
UTF-16捨てたくなってくるだろ
コメント1件

707
デフォルトの名無しさん[sage]   投稿日:2017/03/29 08:08:48  ID:81RbfoHk.net(2)
こういう流行り廃りのあるものはMarkdown emojiのようなやり方で十分だしそっちの方が
便利だと思うがなぁ。そもそも欧米の連中、Unicode入力のためにIMEとか導入してるんだろうか?

708
デフォルトの名無しさん[sage]   投稿日:2017/03/29 12:59:49  ID:v2ySqvAX.net
イングランド、スコットランド、ウェールズは入れたのに北アイルランドは入れなかったのか
しかし U+1F3F4 U+E0067 U+E0062 U+E0065 U+E006E U+E0067 U+E007F を一つの国旗として処理しろってそれは

709
デフォルトの名無しさん[sage]   投稿日:2017/03/29 14:50:05  ID:IUBNo9UW.net
ほらもうこれ、いったい何に使うのっていう
ラインスタンプと比べるともはや・・・
まるで社会主義国家のようだし
今の時代の速度感と全然合ってないんですけど

710
デフォルトの名無しさん[sage]   投稿日:2017/03/29 17:07:28  ID:WAel0act.net
>706
UTF-8ならいいの?
コメント1件

711
デフォルトの名無しさん[sage]   投稿日:2017/03/29 18:47:22  ID:pMdWiHKE.net
>710
そういう意味じゃないでしょ
Unicodeに政治を持ち込むなっていう

712
デフォルトの名無しさん[sage]   投稿日:2017/03/29 21:14:02  ID:81RbfoHk.net(2)
「emojiが使えないUTF-16はオワコン」て意味かと思った。
コメント1件

713
デフォルトの名無しさん[sage]   投稿日:2017/03/30 01:24:25  ID:4z103Fgo.net
iOS 10.3リリース、ファイルシステムがHFS+からAPFSに変更される
https://apple.srad.jp/story/17/03/29/0852227/

Apple、Unicode正規化(もどき)やめるってよ

714
デフォルトの名無しさん[sage]   投稿日:2017/03/30 07:57:02  ID:HGkR55tR.net
U+41 U+0307 U+0308と
U+41 U+0308 U+0307のファイルが同時に作成できるのかな

715
デフォルトの名無しさん[sage]   投稿日:2017/03/31 16:24:48  ID:jxXitrEX.net
http://www.taishukan.co.jp/kokugo/webkoku/series003_03.html

Windowsと同じ「がが」というフォルダを4つ作れるようになるのか

716
デフォルトの名無しさん[sage]   投稿日:2017/03/31 18:39:57  ID:cAvSJqfg.net
> 少なくとも検索に関しては、「ガ」と「ガ」を同じにみなす必要があり、
> <U+FF76 U+FF9E>とU+30ACと<U+30AB U+3099>とを、 全て同じだとみなす必要があるということでしょう。

安岡は何当たり前のこと言ってんだ
JIS信者のクセに慣れないUnicodeについて語るとこういった低レベルな恥ずかしい記事になる

717
デフォルトの名無しさん[sage]   投稿日:2017/04/01 22:40:22  ID:7/71KzK1.net
濁点は独立したコードポイントを持っていても結合文字みたいなものだし、
U+30AB U+309B の場合も「ガ」と同じにみなすべきだろうね、検索の場合

718
デフォルトの名無しさん[sage]   投稿日:2017/04/01 23:09:58  ID:LH/rwisT.net
Unicode(NFKD)的には
「ガ」=「ガ」≠「カ゛」=「カ ゙」
だな

719
デフォルトの名無しさん[sage]   投稿日:2017/04/07 00:08:24  ID:qNFTJj2D.net
U+10FFFFまで埋めないと死んじゃう病にでもかかってるのかね、粗製濫造してんのは
コメント1件

720
デフォルトの名無しさん[sage]   投稿日:2017/04/07 16:00:25  ID:3NFvJvaJ.net
まだ丸々10面分空いてるからな

721
デフォルトの名無しさん[sage]   投稿日:2017/04/12 14:45:57  ID:jhOW+nqF.net
正規化が悪なんじゃなくて、正規化を表に出す事が悪なんだよ
パソコンを裸族で使う様なもんだ
素人にはオススメできない

722
デフォルトの名無しさん[sage]   投稿日:2017/04/13 18:03:47  ID:TzW03HI9.net
>719
困った病気だねぇ。
埋めずに空きをたくさん残しておいた方が未来の子孫に感謝されるぞ。


多分。

723
デフォルトの名無しさん[]   投稿日:2017/04/25 06:30:16  ID:DObvS+Kg.net
>712
UTF-16で使えるじゃん?UCS-2と勘違いしてる?

724
デフォルトの名無しさん[sage]   投稿日:2017/04/26 12:16:19  ID:im3ukcX1.net
そうじゃない

725
デフォルトの名無しさん[sage]   投稿日:2017/05/11 08:21:06
多言語制定で見えてきた課題を一挙に解決してUnicode Neueでも立ち上げたらいいのに
バグをバグのまま残さなきゃいけないなんて仕様として不健全すぎるわ

726
デフォルトの名無しさん[sage]   投稿日:2017/05/11 22:00:06
何故ドイツ語

727
デフォルトの名無しさん[sage]   投稿日:2017/05/17 12:41:42
フォントでよく使うからね

728
デフォルトの名無しさん[sage]   投稿日:2017/05/20 12:07:31
ISO 10646って2月に発行フェーズ入ったのにまだ発行できてないのは
何やってんだ?

729
フはいつものこと []   投稿日:0000/00/00 00:00:00

730
デフォルトの名無しさん[sage]   投稿日:2017/05/26 12:00:03  ID:4g2o9CtM.net
Unicode の Core Specification の日本の元号の説明(日付)が間違ってるのはいつ修正されるんだろう?
コメント2件

731
デフォルトの名無しさん[sage]   投稿日:2017/05/26 17:54:06  ID:RyqPFjFC.net
>730
知らんが参考までに説明箇所を教えて
コメント1件

732
デフォルトの名無しさん[sage]   投稿日:2017/05/26 22:00:22  ID:mIO9asAV.net
>731
https://techracho.bpsinc.jp/chiba-junichi/2016_09_27/25490

他にもあるかもしれませんが、自分はこのページで初めて知りました。

733
デフォルトの名無しさん[]   投稿日:2017/05/27 03:01:17  ID:V3ffhZkY.net
>730-732
TZを間違って読んでるだけでは?
コメント1件

734
デフォルトの名無しさん[sage]   投稿日:2017/05/27 03:15:47  ID:hVyPua6a.net
ヒカル TV出演「年間5億は稼ぐ勢いですね」
https://www.youtube.com/watch?v=G7qL6ftpets
第1回案件王ランキング!YouTuberで1番稼いでるのは誰だ!
https://www.youtube.com/watch?v=asF2wQ2xhjY&;t=61s
ユーチューバーの儲けのカラクリを徹底検証!
https://www.youtube.com/watch?v=FUSb4erJSXE&;t=504s
YouTuberになりたいのは馬鹿じゃない!YouTuberになる方法
https://www.youtube.com/watch?v=Fr0WXXZRMSQ

最高月収5000万円だとさ。年収じゃなくて「月収」な
おまえらもyoutubeに動画投稿したほうがいい
最低2年はやらないとここまではいかないだろうけど才能とアイデアと
企画力と継続力があればが大儲けできる可能性がなくもない
まだまだ他の職種に比べれば競争率は低いからオススメ

735
デフォルトの名無しさん[sage]   投稿日:2017/05/29 19:03:28  ID:K4hEGofc.net
>733
そうじゃないけど、定義としてTZは付与すべきだね

736
デフォルトの名無しさん[sage]   投稿日:2017/05/31 17:05:54  ID:uv8MtfX4.net
TZってちんちんズルムケの略?

737
デフォルトの名無しさん[]   投稿日:2017/06/01 03:44:11  ID:82KsO+uD.net
time zone

738
デフォルトの名無しさん[]   投稿日:2017/06/01 11:37:45  ID:o/dQD8LP.net
thin skin zone

739
デフォルトの名無しさん[sage]   投稿日:2017/06/02 21:34:26  ID:Hl9pjX1u.net

740
デフォルトの名無しさん[sage]   投稿日:2017/06/03 09:51:38  ID:LcU0sJDm.net
寒いからもういいよ

741
デフォルトの名無しさん[sage]   投稿日:2017/06/04 21:55:56  ID:mjDwcbxw.net
正直旗イメージより「伊」「蘭」「仏」とかで表示してくれたほうがわかりやすい国もある

742
デフォルトの名無しさん[sage]   投稿日:2017/06/09 22:09:35  ID:PK+Q1cYY.net
WG2 N4825によると1B130〜1B16FはSmall Kana Extensionにすることにしたらしい
でもreserved forなんてやるくらいなら、使用例があるものはとっとと入れちゃえばいいのに

743
デフォルトの名無しさん[sage]   投稿日:2017/06/09 22:31:03  ID:7OSi6V+4.net
何に使えるのかな
ちっちゃいウンコが書けるようになるぐらいしか思いつかなかった

744
デフォルトの名無しさん[sage]   投稿日:2017/06/10 01:15:56  ID:g45QxHo0.net
http://www.unicode.org/wg2/docs/n4825-pdam2chart.pdf#page=15
annotationは消さない方がいいんじゃないかな…

745
デフォルトの名無しさん[sage]   投稿日:2017/06/11 14:49:02  ID:GyEdwZPX.net
URLが2ちゃんねるアートだと?

746
デフォルトの名無しさん[sage]   投稿日:2017/06/21 08:20:53  ID:GaxJdSrE.net
Announcing The Unicode Standard, Version 10.0
http://blog.unicode.org/2017/06/announcing-unicode-standard-version-1...

747
デフォルトの名無しさん[sage]   投稿日:2017/06/21 10:16:00  ID:bqANLNSg.net
mage
まげ

748
デフォルトの名無しさん[sage]   投稿日:2017/06/21 12:15:04  ID:GUHwFNed.net
もう月次のバージョンアップでいいからCore specificationとUCDの改版を分離してくれ

749
デフォルトの名無しさん[sage]   投稿日:2017/06/21 16:48:48  ID:Rg8XGBQ1.net
Unicode 10.0出たのね
CodeCharts.pdfが100MB超えして落とすの&開くのだるい

750
デフォルトの名無しさん[sage]   投稿日:2017/06/23 14:19:48  ID:xOTwvtKW.net
例示字形でフォント作ってくれないかね
とりあえず表示できればいいっていう場面は意外と多いと思うんだけど
コメント1件

751
デフォルトの名無しさん[]   投稿日:2017/06/23 14:44:56  ID:0OdP20aK.net
2byte+任意の8x64byteみたいなbitmap造ってくれないかな

752
デフォルトの名無しさん[sage]   投稿日:2017/06/23 18:53:47  ID:m93LamaP.net
>750
Noto Fontって全部カバーしてるんじゃないの?

753
デフォルトの名無しさん[sage]   投稿日:2017/06/23 22:22:21  ID:JgWE6lrM.net
Googleはそのつもりなのかもしれないけど、実際にはカバーできてないよ
符号化済みの漢字だけで1フォントの収納限界グリフ数(65535)を超えちゃってるから
全部カバーしようと思ったら漢字フォントだけでも2つ以上に分けないといけない

それなのにNoto CJKは、PanCJKという思想で漢字だけじゃなく仮名やハングルまで
1フォントに押し込んでしまった
おかげでUnicode 10で符号化された変体仮名なんかも入れるスペースがない

754
デフォルトの名無しさん[sage]   投稿日:2017/06/23 23:32:51  ID:vCpZUNAe.net
変体仮名がついにUnicodeに追加されたんだな。
戸籍名に変体仮名が含まれてる可能性のある世代が存命中に間に合ってよかった。
戸籍名以外でも店の看板とかに使われてる事もあって、
うなぎ屋で「うなぎ」の「な」が「ふ」の真ん中を「ち」に変えたようなの(U+1B081)
になってるのは割りと良く見かける。

755
デフォルトの名無しさん[sage]   投稿日:2017/06/25 17:45:14  ID:tWAgqwx7.net
筆記体をそのまま活字体にしちゃうって凄いよな
ハシゴ高もそうだけど

756
デフォルトの名無しさん[]   投稿日:2017/06/25 18:02:05  ID:gomAIGS/.net
ひらがな

757
デフォルトの名無しさん[sage]   投稿日:2017/06/25 22:38:53  ID:zF3XL20Z.net
Unicodeに変体仮名が追加されても、使えるのはUnicode文書の中だけで
戸籍に使えるかは別

758
デフォルトの名無しさん[sage]   投稿日:2017/06/26 00:33:59  ID:fDlZrHxT.net
とりあえずTwitterできもい絵文字の部品として使われることになるだろう
更新情報
・スレッド一覧ページで過去ログのタイトル検索・一覧表示ができるようになりました(2016/1/20)
NGワード登録
登録する
スレッド内検索

プログラム板 タイトル検索

このスレッドが人気です(実況系)
NNNドキュメント「少年A 被害者と加害者の20年」 ★2 (649)NTV実況
オチンチンシュタインの恋 #10[終] ★3 (868)NTV実況
せ、関ジャム…完全燃SHOW ★2 (533)テレ朝実況
ダウンタウンのガキの使い 「ノーリアクション王決定戦」★3 (529)NTV実況
初耳学2時間スペシャル★7 (762)TBS実況
NHKスペシャル「人工知能 天使か悪魔か 2017」★7 (994)NHK実況
S☆1 (423)TBS実況
サンデースポーツ★2 (726)NHK実況
このスレッドが人気です(ニュース系)
【1型糖尿病】インスリン注射「トイレで打って」学校側が生徒の教室での注射を禁じる・・・理解進まぬ教育現場 (937)ニュー速+
【この、ハゲーーーっ!】自民党 豊田真由子衆議院議員が離党届を提出 ★86 (1002)ニュー速+
【この、ハゲーーーっ!】自民党 豊田真由子衆議院議員が離党届を提出 ★87 (326)ニュー速+
【この、ハゲーーーっ!】自民党 豊田真由子衆議院議員が離党届を提出 ★85 (1002)ニュー速+
【NMB48】須藤凜々花 「大金使った人は自己責任」「見返りが無いのに人の夢に投資する、それが愛です」★14 (1001)音楽・芸能ニュース
【この、ハゲーーーっ!】自民党 豊田真由子衆議院議員が離党届を提出 ★84 (1002)ニュー速+
【NMB48】須藤凜々花 「大金使った人は自己責任」「見返りが無いのに人の夢に投資する、それが愛です」★15 (338)音楽・芸能ニュース
【世論調査】都議選 投票先、都民ファースト26.7% 自民党25.9% 共産党13% 公明党12.3% 民進党8.4% −TBS★3 (1001)ニュー速+
プログラム板の人気スレ
ふらっと C#,C♯,C#(初心者用) Part129 (404)
Excel VBA 質問スレ Part48 (998)
Xamarin Part4 (978)
くだすれPython(超初心者用) その34 (556)
【統計分析】機械学習・データマイニング15 (948)
C言語なら俺に聞け 140 (595)
Java入門・初心者質問スレ Part.3 (947)
オブジェクト指向って自然な文法だな 3 (921)
スレ立てるまでもない質問はここで 148匹目 (335)
Pythonのお勉強 Part53 (402)
Visual Studio 2017 Part2 (749)
次世代言語議論スレ[Go Rust Scala Haskell]第5世代 (122)
ねねっちと一緒にプログラムを勉強するスレ第2話 (896)
Swift part10 (977)
Ruby 初心者スレッド Part 60 (415)
JavaScript の質問用スレッド vol.123 (554)
C++相談室 part130 (566)
プログラミング言語 Rust 3 (223)
Git 15 (912)
推薦図書/必読書のためのスレッド 81 (905)
C#, C♯, C#相談室 Part94 (380)
Visual Studio 2015 Part8 (768)
Androidプログラミング質問スレ revision53 (471)
☆★Java質問・相談スレッド180★★ (291)
ふらっと C#,C♯,C#(初心者用) Part127 (408)
関数型プログラミング言語Haskell Part30 (703)
MacでもLinuxでも使えるVisual Studio Code Part2 (149)
テストしにくいコードをテストする方法 その2 (593)
【初心者歓迎】C/C++室 Ver.100【環境依存OK】 (744)
C# vs Java どっちが好き? その3 (359)
このサイトについて
このサイトは2ちゃんねるからデータを取得し、表示するサービスです。
画像のインライン表示機能について
画像のURLの後ろにある[画像をインライン表示]をクリックすると、URLの下に表示します。
表示される画像は横幅100pxに縮小されていて、クリックすると原寸で表示します。
このサイトの特徴
1)スレッド内検索ができます
2)レス(「>>1」など)のポップアップができます
3)不適切な言葉を含む投稿を表示しません
4)ページ内で画像を直接表示できます
5)2ch他スレッドへのリンクはタイトル・板名つきでリンクします
6)すっきりとしたデザインで表示します
7)最新スレや前スレをチェック・一覧表示します
8)NGワード機能の搭載でイヤな言葉が目に入りません
9)荒らしを自動チェックします
10)スレッド内・同一IDの書き込みだけ表示できます
11)レスの返事をレスされた発言の下に表示する「まとめビュー」が利用できます
12)シリーズ化したスレッドの一覧を表示します
13)最新のスレッドがある場合はお知らせします
削除について
こちらをご覧ください
機能要望について
現在機能要望受付中です。
問い合わせについて
こちらのページからどうぞ
広告


首都圏の方、ソフトバンク光オススメですよ


このサイトは2ch.scからデータを取得・表示しています。削除などについてはこちらをご覧ください。 アクセスモード:差分取得 - 正常取得 - 3件 - 取得完了