現在,共有メモリ型並列計算機の主要なアーキテクチャとなっている NUMA (Non-Uniform Memory Access) アーキテクチャを有する計算機上には,各プロセッサと対となるローカルメモリと,他のプロセッサと対となるリモートメモリが存在し,各プロセッサコアと各メインメモリ間の距離が異なるためアクセスコストが均一でない.NUMA アーキテクチャ上での高速化にはコストの大きなリモートメモリへのアクセスを削減することが重要になるものの,並列実行時の各スレッドが計算機トポロジ上のどこに配置しているかといった NUMA アーキテクチャを考慮した制御に必要な情報の取得は,既存ライブラリ群だけでは容易ではない.本研究では CPU アフィニティやローカルメモリ確保などの機能をまとめたライブラリ ULIBC (Ubiquity Library for Intelligently Binding Cores) を開発し,いくつかの並列アルゴリズムに対して,ULIBC を用いた NUMA アーキテクチャを考慮した高速化を示す.